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= (54) Title: STREPTOCOCCUS AGALACTIAE GENOME SEQUENCE. USE FOR DEVELOPING VACCINES. DL\GNOSTIC 
TOOLS, AND FOR IDENTIFYING THERAPEUTIC TARGETS 

<S (54) Titre : SEQUENCE DU GENOME STREPTOCOCCUS AGALACTIAE, APPLICATION AU DEVELOPPEMENT DE VAC- 
CINS, D'OUTILS DE DL\GNOSTlC. ET A UIDENTIFICATION DE CIBLES THERAPEUTIQUES 

^ (57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 
tides, such as cellular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 
f^l replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 
&s vaccines, diagnostic tools. DNA chips and for identifying theiapeutic targets. 

^ (57) Abr^i : Linvention a pour objet la s^uence genomique et des sequences nucl^olidiques codanl pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d'enveloppe cellulaire. ou des polypeptides s6cTet6s ou sp&ifiques, ou impliqu^s 
Q dans le mdtabolisme et dans le processus de replication, ainsi que des vecieurs ou cellules incluani lesdites sequences. Uinvention 
^ porte fgalement sur leur application au d^veloppemeni de vaccins. d'outils de diagnostic, de puces & ADN et k 1' identification de 
^ cibles th^rapeutiques. 
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Sequence du genome Streptococcus agalactiae^ application au d^veloppemient de 
vaccins, d^outils de diagnostic, et k ridentification de cibles th^rapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucI6otidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides s^cr^tds ou specifiques, ou impliques dans 
le mitabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L' invention porte ^galement sur leur application au 
ddveloppement de vaccins, d'outils de diagnostic, de puces a ADN et k ridentification 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque p-hemolytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections n^onatales k 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

15 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialists 
entre 4 et 10 % selon les Etudes. Cette bact6rie est responsable d*environ 20 % des 
meningites bacteriennes recensees en France et des sequelles neurologiques sont alors 
observees dans 25 a 50 % des cas. Elle est egalement a Torigine de mort foetale in utero. 

20 Le polyoside capsulaire est Tantigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont gtntralement ddtectes au cours des infections humaines, le serotype 
III etant retrouve dans 75 % des infections neonatales avec atteinte mtningee. Au 
niveau cellulaire et moleculaire, les difftrentes etapes du processus infectieux du a 5, 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee ptnetre 
dans les cellules de Tepithelium alvtolaire du nouveau-nt et traverse cette barriere pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore tres mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a Hi clairement demontre est le polyoside capsulaire qui permet 
Techappement au systeme immunitaire de Thote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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Une recherche realisee sur le site EXPASY (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprol et 
TREMBL. Ce nombre inclut des prot^ines codecs par des plasmides de S. agalaciiae, 
Ces sequences repr^sentent done line vision partielle d'un nombre limite d'aspect de la 
5 biologic de S. agalactiae. La biosynthSse de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les gSnes codant 
pour 6 prot^ines exposdes k la surface sont dgalement connus (3). 

Afin d'apprdhender de maniere globale les determinants gdndtiques impliqufe 

10 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sdquenfage 
du genome de Streptococcus agalactiae a €i6 rdalisd. Le genome de la souche 
Streptococcus agalactiae CIP 82,45 (ATCC 12403) qui a 6i6 responsable d'une 
septicemic mortelle a 6x6 choisi pour ce sequen9age. Cette souche possede lin serotype 
capsulaire III, ne prdsente pas de r&istance acquise aux antibiotiques, est gdnetiquement 

15 modifiable et est virulente dans un module d*infection murin. La connaissance complete 
du genome est une dtape cruciale pour la caracterisation des gSnes impliquds dans le 
ddveloppement du processus infectieux : adhesion et franchissement des structures 
epitheliales, dchappement au systeme immunitaire et adaptation a des conditions de 
culture varices et souvenl hostiles (pH, stress oxydatif et carences nutritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de 5. agalactiae avec ceux d'autres pathogenes a Gram positif 
{Streptococcus pyogenes, Streptococcus pneumoniae, Streptococcus mutans, 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre d'identifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour construire des souches de 

25 virulence attdnudes et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane el presenlant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete oblenue. Ce genome est constitue d*un chromosome long 
d'environ 2,2 Mb identifi6 ici sous forme de 138 contigs represent^ par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche s^quencte reprdsent^ par la s^uence SEQ ID 
No. 137. La sequence complete du genome est reprdscntde par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotdes identifides par Fanalyse des sequences de 
5 ces contigs est donnde au tableau 1 . 

Une liste des phases codantes pour des prot6ines de surface nouvellement 
identifiees est donn6e au tableau 2 comme indiqu6 prdcddemment. 

Une liste des phases codantes annotdes identifiees par Tanalyse de la sequence 
gdnomique complete SEQ ID No. 2345 est donnee au tableau 3. 
10 Une liste des phases codantes pour des protdines de surface identifiees a partir 

de Tanalyse de la sequence genomique complete SEQ ID No. 2345 est denude au 
tableau 6 (protdines lides au peptidoglycane), tableau 8 (lipoprotdines).Tableau 9 (autres 
proteines de suface). Tableau 10( protdines impliquees dans la biosynthdse des 
composds polysaccharidiques) 

15 

La prdsente invention conceme les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caractdriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 gdnomique preparee a partir du gdnome de cette souche et ddposde k la CNCM le 28 
ddcembre 2000 sous le numero 1-2610, ainsi que de tous les g^nes et sequences 
rdgulalrices non codantes contenus dans ledit genome. 

La presente invention conceme done une sequence nucleotidique isolde et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 139 et la sequence SEQ ID No. 2345. 

La presente invention conceme egalement une sequence nucleotidique Isolde 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % dMdentite avec une sequence choisie parmi SEQ ID No. 1 k SEQ ID No. 1 39 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucltotidique compl^mentaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou compl^meritaire d'une sequence 

5 nucl^otidique telle que d^finie en a), ou b), ou une sequence nucleotidique de TARN 
correspondant k Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment repr^sentatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que d^fmie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 
200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que defmie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que defmie en a), b), c), d) ou e) modifiee, de 
1 5 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport i la sequence de reference. 

De fa^on plus particuliere, la presente invention a egalement pour objet les 
sequences nucleotidiques isoiees et/ou purifiees, caracterisees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 k SEQ ID 
No. 2344, et SEQ ID No. 2346 k SEQ ID No. 4481. 

La presente invention conceme aussi de fafon plus generale les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent eUe 
25 isoiees a partir de SEQ ID No. I a SEQ ID No. 139 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isoiees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
. 98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 
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c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No, 140 a SEQ ID No. 2344 et SEQ ID No. 2346 k SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de prdftrence 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d*ARN correspondant k une 
sequence telle que d^finie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d*une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 

f) une sequence telle que defmie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de Tinvention. 

Selon une realisation avantageuse, Tinvention a pour objet les sequences 
nucieotidiques isoiees et/ caracterisees en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 6617 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % dMdentite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 a SEQ ID 

25 No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 
75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant k une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fi-agment representatif d'une sequence telle que 
30 definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 
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f) line sequence telle que definie en a), b), c), d) ou e) modifiee, de priftrence 
comportant au plus 10 %, 5 %, 1 % qu 0,5 % de nucleotides modifies par rapport & la 
sequence de r6f(£rence, 

5 Par acide nucleique, sequence nucMique ou d'acide nucl^ique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucl^otidique, termes qui seront 
employes indifferemment dans la pr&ente description, on entend designer un 
enchalnement precis de nucleotides, modifies ou non, permettant de definir un Augment 
ou une region d*im acide nucleique, comportant ou non des nucleotides non naturels, et 

10 pouvant correspondre aussi bien a un ADN double brin, un ADN simple brin qu'i des 
produits de transcription desdits ADNs. Ainsi, les sequences nucieiques selon 
rinvention englobent egalement les PNA (Peptid Nucleic Acid). 

11 doit etre compris que la presente invention ne conceme pas les sequences 
nucieotidiques dans leur environnement chromosomique naturel, c*est-4-dire k Petat 

1 5 naturel. II s'agit de sequences qui ont ete isoiees et/ou purifiees, c'est-a-dire qu'elles ont 
ete preievees directement ou indirectement, par exemple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucieiques obtenus par synlhese chimique. 

Par « pourcentage d'identite » entre deux sequences d* acides nucieiques ou 

20 d*acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 

25 optimal", Talignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eieve. Les comparaisons de sequences entre deux sequences d*acides 
nucieiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladile comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 

30 regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de ralgorilhme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
Palgorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afin d'obtenir l*alignement optimal, on utilise de prifiSrence le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut 6galement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucldiques ou d'acides 
amines est determine en comparant ces deux sequences aligndes de maniSre optimale, la 
sequence d*acides nucleiques ou d'acides amines a comparer pouvant comprendre des 

10 additions ou des d616tions par rapport k la sequence de refiSrence pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identit^ est calculi en ddtenninant 
le nombre de positions identiques pour lesquelles le nucleotide ou le rdsidu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 

1 5 obtenu par 1 00 pour obtenir le pourcentage d'identit6 entre ces deux sequences. 

Par sequences nucleiques pr^sentant un pourcentage d'identiti d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de faton plus prefer^e 95 % voire 98 %. aprfa 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de rdftrence, certaines 

20 modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notanunent ponctuelle, et dent la sequence 
nucleique pr^sente au moins 75 %, de preference 80 %, 85 %, 90 %. 95 % ou 98 %, 
d'idenlite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences compl6mentaires sont susceptibles de 

25 s'hybrider sp^cifiquement avec les sequences de r^ftrence. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % dMdentit^ 
apres alignement optimal enU-e Tune des deux sequences et sa sequence 
compl^mentaire. 

30 Une hybridation dans des conditions de forte stringence signifie que les 

conditions de temperature et de force ionique sont choisies de telle manifere qu'elles 
permettent le maintien de I'hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de I'dtape d'hybridation aux fins de 
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d^finir les fragments polynucMotidiques d^crits ci-dessus, sont avantageusement les 
suivantes. 

L*hybridation ADN-ADN ou ADN-ARN est rdalis^e en deux Stapes : (1) 
prahybridation k Al^'C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC con-espond i une solution 0,15 M NaCl + 0,015 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures k une temperature dependant de la taille de la sonde 
(i.e. : 42''C, pour une sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 
10 minutes a 20*^0 en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratiqu6 en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d*hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille defmie, peuvent 
etre adapt^es par I'homme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon I'enseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2""^ Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon I'invention, on entend 
designer tout fragment nucleotidique presentant au moins 15 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1500 cons^cutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend ^galement les sequences interg^niques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, .). 

Parmi lesdits fragments repr^sentatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denomm^s sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
dMnitiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 100 acides amines, tel que par exemple, sans s'y' 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotalion des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la pr&ente description correspond a la numdrotation des sequences d'acides 
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aminds des prot^ines codecs par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 k SEQ ID No.448I . 

Les fragments repr^sentatifs selon rinvention peuvent gtre obtenus par exemple 
par amplification specifique telle que la PCR ou apr^s digestion par des en2ymes de 

5 restriction appropri^s de sequences nucl^otidiques selon I'invention, cette m^thode 6tant 
d^crite en particulier dans I'ouvrage de Sambrook et al.. Lesdits fragments 
repr&entatifs peuvent ^galement Itre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des m^thodes bien connues de I'homme du mdtier. 

Parmi les sequences contenant des sequences de I'invention, ou des fragments 

10 repi^sentatifs, on entend dgalement les sequences qui sent naturellement encadr^es par 
des sequences qui presented au moins 75 %, 80 %. 85 %, 90 %, 95 % ou 98 % 
d'identit^ avec les s6quences selon I'invention. 

Far sequence nucl^otidique raodifi6e, on entend toute sequence nucltotidique 
obtenue par mutagenfese selon des techniques bien connues de I'homme du mdtier, et 

15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences r^gulatrices et/ou promotrices de I'expression du 
polypeptide, notamment conduisant h une modification du taux d'expression ou de 

I'activit^ dudit polypeptide. 

Par sequence nucldotidique modifiee, on entend egalement toute sequence 
20 nucHotidique codant pour un polypeptide modifi€ tel que definit ci-apr^s. 

Concemant les sequences nucleiques ou ORP codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
reprdsentdes respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L'invention conceme avantageusement une sequence nucleotidique isol6e de 
25 Streptococcus agalactiae, caractdrisde en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N" 
6194,6236.5497,5791,5103.4705.5610,5234,4926,6331,6247,5842,5741,4921,5090, 
5180,4706,4708,5677,6246.6411.5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,6331,5491,5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d*AKN correspondant & une 
sequence telle que d^finle en a), b) ou c) ; 

e) une sequence nucleotidique d*un fragment representatif d'une sequence telle 
que ddfinie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modifi^e et comportant 

au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

L*invention conceme dgalement les polypeptides codes par ces sequences. 

10 L'invention conceme egalement avantageusement une sequence nucleotidique 

Isolde de Streptococcus agalactiae caracterisee en ce qu'elle est choisie paimi les 
sequences SEQ ID 

N°6035,6137,6335,6377,6386,4495,4596,4636,4730,4816,4836,4906,4920,49^ 
5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923; et en ce 

15 qu'elle code pour une lipoprot^ine. LMnvention conceme Egalement les polypeptides 
codes par ces sequences. 

LMnvention conceme egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 N°4861,6214,6061,6517,6518,6519,4743,6343,6342,5326,4952,5619,5618,5617,5616, 
5615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention conceme egalement les polypeptides codes par 

25 ces sequences. 

Les fragments repr^sentatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des procedes de detection, d' identification, 
de dosage ou d'amplification de sequences nucleiques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin denature 
comprenant par example de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificity 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucl^ique cible. 
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Les sondes et amorces selon Tinvention peuvent etre marquees directement ou 
indirectement par un compost radioactif ou non radioactif par des m^thodes bien 
connues de rhomme du mdtier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon i'invention peuvent Stre 

utilis^es directement comme sonde ou amorce. 

Les sequences sont g6n6ralement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon rinvention est r6alis6 par des Elements radioactifs ou par des molecules non 
10 radioactives. 

Paimi les isotopes radioactifs utilises, on peut citer le ^^P, le ^^P, le ^^S, le ou 
le "^^L Les entit^s non radioactives sont selectionn^es parmi les ligands tels la biotine, 
I'avidine, la streptavidine, la dioxyg^nine, les haptfenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon Tinvention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des proced^s mettant en oeuvre notamment la technique de PGR 
(amplification en chaine par polymerase) (Rolfs et aL, 1991, Berlin : Springer-Verlag). 
Cette technique n^cessite le choix de paires d'amorces oligonucieotidiques encadrant le 

20 fragment qui doit etre amplifi^. On peut, par exemple, se referer a la technique ddcrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d'agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographic echangeuse d'ions, puis sequences. La specificite de I'amplification 

25 peut etre controlee en utilisant les sequences nucl^otldiques de polynucleotides de 
rinvention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d'amplification derives. Les fragments nucl^otidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 complementaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise dgalement les acides nucl^iques susceptibles d'etre obtenus par 
amplification a I'aide d'amorces selon rinvention. 

D'autres techniques d'amplification de I'acide nucleique cible peuvent etre 
avantageusement employees comme alternative k la PCR (PCR-Iike) a Taide de couple 
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d'amorces de sequences nucleotidiques selon Tinvention. Par PCR-like on entend 
designer toutes les m^thodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucldiques, ou bien dans lesquelles les systemes de marquagc 
ont ^te amplifies, ces techniques sent bien entendu connues. En gen&al il s*agit de 
5 I'amplification de TADN par une polymerase ; lorsque Techantillon d'origine est un 
ARN il convient pr^alablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux proc6d& permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a d^placement de brin (Walker et al., 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. Sci., USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
d6crite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Veriag, Beriin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d*ampIification a la Q-beta-repHcase decrite 

20 par Miele et al. (1983, J. Mol. Biol, 171, 281). Certaines de ces techniques ont depuis 
&i€ perfectionn^es. 

Dans le cas ou le polynucleotide cible a d^tecter est un ARNm, on utilise 
avantageusement, pr^alablement a la mise en oeuvre d'une reaction d'amplification i 
Taide des amorces selon Tinvention ou a la mise en oeuvre d'un procede de detection k 

25 I'aide des sondes de Tinvention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de TARNm contenu dans rechantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procede 
d'amplification ou de detection selon I'invention. 

La technique d'hybridation de sondes pent etre realis6e de mani^res diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generale 
consiste a immobiiiser I'acide nucleique extrait des cellules de difftrents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien definies, I'acide nucleique cible immobilise avec la 
sonde. Apres Phybridation, Texces de sonde est elimin^ et les molecules hybrides 
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fornixes sont d^tecties par la m^thode appropri^e (mesurc de la radioacliviti, de la 
fluorescence ou de I'activit^ enzymatique li^ k la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucldiques selon I'invention, 
ces demidres peuvent Stre utilis&s conrnie sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisie sur un support et sert k capturer par 
hybridation specifique Tacide nucl^ique cible obtenu i partir de P&hantillon blologique 
k tester et Tacide nucleique cible est ensuite d£tect6 grace a une seconde sonde, dite 
« sonde de detection », marqude par un ildment facilement detectable. 

Parmi les fragments d'acides nucldiques int^ressants, il faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-S-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de Texpression du produit 
correspondant II faut dgalement citer les oligonucleotides sens qui, par interaction avec 
des proteines imph'quees dans la regulation de Texpression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De fa9on prdferee, les sondes ou amorces selon Tinvention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support pent 
etre une puce a ADN ou un filtre k haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
materiau du support, et eventuelleraent le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents precedes de fabrication. En 
particulier, on peut efTectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent a effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces differents precedes sont bien connus de Fhomme du metier. 

Une sequence nucieotidique (sonde ou amorce) selon I'invention permet done la 
detection el/ou Tamplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce k 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces k ADN ou de filtres a haute density permet en effet de 
ddterminer I'expression de genes dans un organisme pr&enlant une sequence 
g^nomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence gdnomique de Streptococcus agalactiae, compl^tee par 
5 ridentification des genes de ces organismes, telle que prdsent^e dans la prdsente 
invention, sert de base k la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste k synth^tiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des gSnes ou a des fragments plus internes pour 
amplifier des fragments d'une taille adaptee, par exemple comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence g^nomique et ses 
annotations divulgu^es par la pr^sente invention. La temperature d*apparieraent des ces 
oligonucleotides aux places correspondantes sur TADN doit Stre approximativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d*ADN 
correspondant a chaque gene par Tutilisation de conditions de PCR appropriees dans un 

1 5 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour Thybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier Texpression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
compiementaires, et en les hybridant a TADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variabilite des souches ou des especes, en preparant I'ADN de ces organismes et en les 

25 hybridant a I'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des difGerentes souches ou 
especes peuvent grandement affecler I'intensite de I'hybridation et, par consequent, 
perrurber rinierpretation des resultats. 11 peut done etre necessaire d*avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decriie plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae ^ notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 



wo 02/092818 



15 



PCT/JB02/03059 



Les Sequences nucMotidiques selon I'invention peuvent etre utilis^es dans des 
puces ^ ADN pour effectuer I'analyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon rinvention. On pourra notamment i cette fin mettre en oeuvre les techniques de 
5 inicros&iuen9age sur puce a ADN. Les mutations sont d^tect^es par extension 
d'amorces immobilisees hybridant k la matrice des sequences analys6es, juste en 
position adjacente de celle du nucleotide mut6 recherche. Une matrice simple brin, ARN 
ou ADN, des sequences k analyser sera avantageuscment pr^par^e selon des m^thodes 
classiques, a partir de produits amplifies selon les techniques de type PGR. Les matrices 

10 d*ADN simple brin, ou d'ARN ainsi obtenues sont alors depos^es sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
. Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement Textremite 3' de Tamorce immobilisee avec un analogue de nucleotide 
marque compiementaire du nucleotide en position du site variable ; par exemple, un 

15 cyclage thermique est realise en presence des dideoxyribonucieotides fluorescents. Les 
conditions experimentales seront adaptees notanmient aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequen9age, par rapport aux techniques basees sur I'hybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homogenes ; utilise sur des 
puces i ADN, il permet une resolution et une specificite optimales pour la detection 
routiniere et industrielle de mutations en muUiplex. 

Une puce a ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou ridentificalion d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon Tinvention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apr^s designees comme bacteries associees a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Une puce a ADN ou un filtre selon I'invention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou I'identification de micro-organismes, 
en particulier les bacteries appartenant k I'espece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de T invention. 
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Par ailleurs, les puces h ADN ou les filtres selon rinvention, contenant des 
sondes ou amorces sp^cifiques de Streptococcus agalactiae^ sont des 61^ments tres 
avantageux de kits ou n^cessaires pour la detection et/ou la quantification de 
I'expression de g^nes de Streptococcus agalactiae (ou de micro-organismes assocife). 
5 En ^ffet, le controle de Texpression des gfenes est un point critique pour 

optimiser la croissance et le rendement d*une souche, soit en permettant Texpression 
d'un ou plusieurs gfenes nouveaux, soit en modifiant Texpression de g^nes presents 
dans la cellule. La pr&ente invention foumit Tensemble des sequences naturellement 
actives chez Streptococcus agalactiae permettant Texpression des g^nes, Elle permet 

10 ainsi la d^tenmination de Tensemble des sequences exprim&s chez Streptococcus 
agalactiae. Elle foumit ^galement un outil permettant de rep6rer les g^nes dent 
Texpression suit un schema donn6. Pour realiser cela, T ADN de tout ou partie des gdnes 
de Streptococcus agalactiae peut etre amplifi^ grace a des amorces selon Tinvention, 
puis fix^ k un support comme par exemple le verre ou le nylon ou une puce a ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces gfenes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation k 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon Tinvention). En r^p^tant cette 
experience a differents instants et en combinant Tensemble de ces donn^es par un 

20 traitement approprid, on obtient alors les profils d'expression de Tensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise k profit pour rechercher de maniere dirig^e, par exemple par homologie, 
d*autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle pr^sente en amont des segments servant de sondes et d*en suivre Tactivite a 
Taide de moyen approprie comme un gene rapporteur (luciftrase, p-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblies par ingenierie 
metabolique avec des sequences d'intdret en vue de leur expression optimale. 

LMnvention conceme egalement les polypeptides codds par une sequence 

30 nucleotidique selon Tinvention, de preference, par un fragment represenlatif des 
sequences precedenies et correspondant a une sequence ORF. En paniculier, les 
polypeptides de Streptococcus agalactiae CIP 82.45 (ATCC 12403) de SEQ ID No. 140 
a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de Tinvention. 
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L' invention comprend egalement les polypeptides caract€ris6s en ce quMls 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon T invention ; 

b) un polypeptide pr^sentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 dMdentite avec un polypeptide selon I'invention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d*un polypeptide selon Tinvention, ou tel que 
defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon I'invention, ou tel que 
10 defini en b) ou c) ; et 

e) un polypeptide selon I'invention, ou tel que defini en b), c) ou d) modifie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucieotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de Tinvention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de generer une reponse anticorps. 

II doit etre compris que I'invention ne conceme pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle conceme ceux qui ont pu etre isoies ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80 %, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon I'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non consecutif(s) sont remplaces par des 
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acides amines « Equivalents ». L'expression « acides amines Equivalents » vise ici a 
designer tout acide aminE susceptible d'etre substitue a Tun des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides conespondant telles qu'elles seront definies par la suite. 
5 Ces acides amines Equivalents peuvent etre dEtermines soit en s'appuyant sur 

leur homologie de structure avec les acides aminEs auxquels ils se substituent, soit sur 
des rEsultats d'essais comparatifs d'activitE biologique entre les diffErents polypeptides 
susceptibles d'etre effectuEs. 

A titre d'exemple, on mentionne les possibilitEs de substitution susceptibles 

10 d'etre effectuEes sans quMl rEsulte en une modification approfondie de I'activitE 
biologique du polypeptide modifiE correspondant. On peut remplacer ainsi la leucine 
par la valine ou Pisoleucine, Tacide aspartique par Tacide glutamine, la glutamine par 
Tasparagine, Targinine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

16 Les polypeptides homologues correspondent Egalement aux polypeptides codEs 

par les sEquences nuclEotidiques homologues ou identiques, telles que definies 
precEdemment et comprennent ainsi dans la presente dEfinition des polypeptides mutEs 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus, et qui conespondent notamment a des troncatures, substitutions, 

20 dElEtions et/ou additions, d'au moins un rEsidu d'acides aminEs. 

11 est entendu que Ton calcule le pourcentage d'identitE entre deux polypeptides 
de la meme fa9on qu'entre deux sequences d'acides nuclEiques. Ainsi, le pourcentage 
d'identitE entre deux polypeptides est calcuIE apres alignement optimal de ces deux 
sEquences, sur une fenetre d'homologie maximale. Pour dEfinir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nuclEique. 

Par fragment biologiquement actif d'un polypeptide selon Tinvention, on entend 
dEsigner en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon I'invention, 
30 notamment en ce qu'il est capable d'exercer de maniere generale une activite meme 
partielle, telle que par exemple : 

- une activitE enzymatique (mEtabolique) ou une activite pouvant etre 
impliquEe dans la biosynthese ou la biodEgradation de composEs organiques ou 
inorganiques ; 
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- une activit6 structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activity de transport (d'^nergie, d'ion) ; ou dans la sdcr^tion dc prot6ine ; 

- une activity dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notaniment de i'ADN, de TARN ou des 

proteines. 

Par fragment de polypeptide selon Tinvention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, 50, 75, 100 et 150 acides amines. 

10 Les fragments de polypeptides peuvent correspondre k des fiagments isol6s ou 

purifies naturellement presents dans les souches de Streptococcus, ou k des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme proteolitique 
telle que la trypsine ou la chymotrypsine ou la collag^nase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en pla9ant ledit polypeptide dans un environnement 

15 tres acide (par exemple i pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthase chimique, k partir d'hdtes transform^ par un vecteur 
d'expression selon T invention qui contiennent un acide nucleique permettant 
Texpression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie» d'un polypeptide selon IMnvention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthase chimique 
comme d^crit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment porttes sur des acides 
amines necessaires pour la specificite ou refficacite de I'activite, ou a Torigine de la 

25 conformation structurale, de la charge, ou de I'hydrophobicite du polypeptide selon 
IMnvention. On peut ainsi cr^er des polypeptides d'activite ^quivalente, augment^ ou 
diminuee, ou de specificite ^quivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a Textremite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objeclif 
notamment : 

- de permettre sa mise en oeuvre dans des proced6s de biosynthese ou de 
biod^gradation de composes organiques ou inorganiques. 
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- de permettre sa mise en oeuvre dans des procddfe de replication, 
d'amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de TADN, TARN, ou de proteines, 

- de permettre sa s^cr^tion am^liorfe, 

5 - de modifier sa solubility, Tefficacity ou la specificity de son activity, ou 

encore de faciliter sa purification. 

La synthase chimique presente ^galement I'avantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou des 
1 0 analogues d*acides amines, notamment des formes souffr^es. 

La presente invention foumit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere prefyr^e, I'invention est relative a une sequence nucleotidique 
15 selon I'invention, caracterisye en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu^ dans la 
biosynthese des acides amines. 

De maniere pryf^rde, T invention est relative a une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporteurs. 

De maniere prefer6e, I'invention est relative k une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere pr^fdrde, I'invention est relative a une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere pref^ree, ['invention est relative a one sequence nucleotidique selon 

rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
mdtabolisme intermediaire central. 
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De maniere pr^Kree, IMnvenlion est relative & une sequence nucWotidique selon 
rinvention, caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou irn de ses fragments impliqu^ dans le 
m^tabolisme ^nergitique. 
5 De manifere prefer^e, invention est relative a une sequence nucl6otidique selon 

rinvention, caractdris^e en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 dans le 
metabolisme des acides gras et des phospholipides. 

De maniSre preftr^e, rinvention est relative a une sequence nucHotidique selon 
10 rinvention, caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De manifere pr^Kr^e, rinvention est relative a une sequence nucleotidique selon 
rinvention, caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, rinvention est relative une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 

20 de replication. 

De maniere preftree, rinvention est relative k une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, I'invention est relative a une sequence nucleotidique selon 

rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, I'invention est relative a une sequence nucleotidique selon 
30 rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, I'invention est relative a une sequence nucleotidique selon 
rinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou lin de ses fragments impliqu^ dans Tadaptation 
aux conditions atypiques. 

De maniere pr^ftree, Tinvention est relative i une sequence nucleotidique selon 
rinvention, caractiriste en ce qu*elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibility aux 
medicaments et analogues. 

De manifere pr^fdrde, Tinvention est relative a une sequence nucleotidique selon 
rinvention, caractdrisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
10 fonctions relatives aux transposons. 

De manifere priftrie, rinvention est relative i une sequence nucleotidique selon 
rinvention, caracteriste en ce qu'elle code pour un polypeptide spdcifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, rinvention a pour objet un 
15 polypeptide selon rinvention, caracteris6 en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
dans la biosynthfese des acides amines. 

Sous un autre aspect, de maniere prdftr^e, I'invention a pour objet un 
polypeptide selon rinvention, caracterise en ce quMl s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynth^se des cofacteurs, groupes prosthetiques et transporteurs. 

Sous un autre aspect, de maniere pr^ftree, I'invention a pour objet un 
polypeptide selon rinvention, caracterise en ce quMl s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 1 2403) ou un de ses fragments. 

Sous im autre aspect, de maniere preftrte, I'invention a pour objet un 
polypeptide selon rinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de maniere preferee, I'invention a pour objet un 

polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le m^tabolisme interm^diaire central. 
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Sous un autre aspect, de maniere prefer^e, I'invention a pour objet un 
polypeptide selon rinvention, caract6ris6 en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
dans le mdtabolisme energ^tique. 
5 Sous un autre aspect, de maniere preftr^e, Tinvention a pour objet un 

polypeptide selon IMnvention, caractdrise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
dans le metabolisme des acides gras et des phosphoHpides. 

Sous un autre aspect, de maniere prdfdr6e, I'invention a pour objet un 
10 polypeptide selon I'invention, caractdris6 en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, I'invention a pour objet un 
polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqud 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preftree, I'invention a pour objet un 
polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu^ 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, I'invention a pour objet un 
polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, I'invention a pour objet un 

polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, I'invention a pour objet un 
30 polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, I'invention a pour objet un 
polypeptide selon I'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
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Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqui 
dans I'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere pr^feree, Tinvention a pour objet un 
polypeptide selon Tinvention, caracterisd en ce quMl s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibility aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, Tinvention a pour objet un 
polypeptide selon I'invention, caracterisd en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
10 dans les fonctions relatives aux transposons. 

Sous un autre aspect, de maniere preftr^e, Tinvention a pour objet un 
polypeptide selon Tinvention, caract^ris^ en ce qu'il s'agit d'un polypeptide sp^cifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L'invention a ^galement pour objet les op^rons impliqu^s dans la synthese 
1 5 d'antibiotiques et/ou de toxines. 

Le tableau 1 foumit la liste de certains polypeptides selon Tinvention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observ^es apres comparaison dans les bases de donnees. 

11 est important de noter toutefois qu'un organisme vivant est un tout et doit etre 
pris comme tel. Ainsi, afm de pouvoir se developper et exhiber ses propri^t^s, tout 
organisme a besoin d'interactions entre les differentes voies m^taboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre considdr^e comme limitative, un gene 
pouvant etre impliqu^ dans deux voies metaboliques distinctes. 

La presente invention a egalement pour objet les sequences nucleotidiques et/ou 
de polypeptides selon I'invention, caract^ris^es en ce que lesdites sequences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, Tanalyse et/ou rexploilation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations exlraites de la presente invention, 
noiammenl les analogies avec des sequences deja connues, et/ou des informations 
concemani les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afm de faciliter Panalyse comparative et Texploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on prefere en particulier les supports 
lisibles par un ordinateur, tels les supports magn6tiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d*enregistrement sont egalement objet de I'invention. 

Les supports d'enregistrement selon rinvention, avec les infonnations 
apporttes, sont tr&s utiles pour le choix d'amorces ou de sondes nucl6otidiques pour la 
5 determination de g^nes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, Tutilisation de ces supports pour T^tude 
du polymorphisme g^n^tique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de colindarit^, est 
tr&s utile dans la mesure ou ces supports foumissent non seulement la sequence 
10 nucl^otidique du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
Egalement I'organisation g^nomique dans ladite sequence. Ainsi, les utilisations de 
supports d*enregistrement selon Tinvention sont Egalement des objets de Tinvention. 

L'analyse d'homologie entre difiKrentes sequences s'efTectue en efTet 
avantageusement & I'aide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, d^crits pr^c^demment. 

L'invention vise Egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucl^otidique selon l'invention. 

Les vecteurs selon l'invention comportent de prdftrence des elements qui 
permettent Texpression et/ou la s&r^tion des sequences nucl6otidiques dans une cellule 
20 h6te ddtermin^e. 

Le vecteur doit alors comporter un promoteur, des signaux d'initiation et de 
terminaison de la traduction, ainsi que des regions apprcpri^es de regulation de la 
transcription. II doit pouvoir etre maintenu de fa9on stable dans la cellule bote et pent 
dventuellement poss6der des signaux particuliers qui specifient la s^cr^tion de la 
25 proteine traduite. Ces diflSrents elements sont choisis et optimises par Thomme du 
metier en fonction de I'hote cellulaire utilise. A cet elfet, les sequences nucieotidiques 
selon rinvention peuvent etre inserees dans des vecteurs a reph"cation autonome au sein 
de rhote choisi, ou etre des vecteurs integratifs de I'hote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 rhomme du metier, et les clones resultant peuvent etre introduits dans un bote approprie 
par des methodes standards, telles que la lipofection, I'eiectroporation, le choc 
thermique, oudes methodes chimiques. 
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Les vecteurs selon Tinvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules botes afin de doner 
ou d'exprimer les sequences nucleotidiques selon Tinvention. 

LMnvention comprend 6galement les cellules botes transform^es par un vecteur 
5 selon rinvention. 

L'hote cellulaire pent etre choisi parmi des systfemes procaryotes ou eucaiyotes, 
par exemple les cellules bact^riennes mais egalement les cellules de levure ou les 
cellules animales, en particulier les cellules de mammiferes. On peut Egalement utiliser 
des cellules d'insectes ou des cellules de plantes. Les cellules botes pr^ferees selon 
10 rinvention sont en particulier les cellules procaryotes, de preference les bact^ries 
appartenant • au genre Streptococcus^ i Tesp^ce Streptococcus agalactiae^ plus 
particuli^rement Streptococcus agalactiae CIP 82.45 (ATCC 12403), pu les micro- 
organismes associes a Tesp^ce Streptococcus agalactiae, 

L'invention conceme Egalement les vegetaux et les animaux, except^ Thomme, 
15 qui comprennent une cellule transform^e selon rinvention. Les cellules transformdes 
selon I'invention sont utilisables dans des procdd^s de preparation de polypeptides 
recombinants selon I'invention. Les procedes de preparation d*un polypeptide selon 
rinvention sous forme recombinante, caracterises en ce qu'ils mettent en oeuvre un 
vecteur et/ou une cellule transformee par im vecteur selon rinvention sont eux-memes 
20 compris dans la presente invention. De preference, on cultive une cellule transformee 
par un vecteur selon I'invention dans des conditions qui permettent I'expression dudit 
polypeptide et on r^cupere ledit peptide recombinant. 

Ainsi qu'il a et^ dit, I'hote cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d'identifier des sequences 
25 nucleotidiques selon I'invention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur selon rinvention portant une telle sequence peut done etre 
avantageusement utilise pour la production de prot^ines recombinantes, destinees a etre 
sdcretdes. En effet, la purification de ces proteines recombinanies d'interet sera facilitee 
par le fait qu'elles sont presentent dans le sumageant de la culture cellulaire plutot qu'a 
30 rinterieur des cellules botes. 

On peut egalement preparer les polypeptides selon I'invention par synthese 
chimique. Un tel proced^ de preparation est egalement un objet de I'invention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, 
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Solid phase peptides synthesis. Pierce Chem. Company, Rockford, 111, 26mc €d., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont ^galement compris dans Tinvention. 

LMnvention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon I'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez I'homme ou I'animal. 

Avantageusement, le determinant antigenique est tel qu'il est susceptible 
1 0 d'induire une rdponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon rinvention sous forme glycosyl6e, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyl^s font 6galement partie de 
15 rinvention. 

Ces molecules hybrides peuvent etre constituees en partie d'une molecule 
poiteuse de polypeptides ou de leurs fragments selon I'invention, associee a une partie 
eventuellement immunogene, en particulier un Epitope de la toxine dipht^rique, la 
toxine tetanique, un antigene de surface du virus de Thepatite B (brevet FR 79 2181 1), 
20 I'antigene VPl du virus de la poliomyelite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les precedes de synthese des molecules hybrides englobent les m^thodes 
utilisees en genie gen^tique pour construire des sequences nucleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des prot^ines 
de fusion decrite par Minton en 1984. 

Lesdites sequences nucleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon I'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par 1' expression desdites sequences nucleotidiques 
30 hybrides, font ^galement partie de I'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules holes 
transform^es par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules iransformees ainsi que les proced& de preparation de polypeptides 
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recombinants utilisanl lesdits vecteurs, lesdites cellules transform^es et/ou lesdits 
animaux transg^niques font egalement partie de Tinvention. 

Le couplage entre un polypeptide selon Tinvention et un polypeptide 
inununogene peut etre effectu6 par voie chimique, ou par voie biologique. Ainsi, selon 
5 rinvention, il est possible d'mtroduire un ou plusieurs 61^ment(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
rinvention, et le polypeptide immunostimulateur, le couplage covalent de Tantigene 
immunostimulateur pouvant etre realist i Textremit^ N ou C-terminale du polypeptide 
selon rinvention. Les reactifs bifonctionnels permettant ce couplage sont determines en 

10 fonction de I'extr^mit^ choisie pour r^aliser ce couplage, et les techniques de couplage 
sont bien connues de Thomme du metier. 

Les conjugu& issus d'un couplage de peptides peuvent etre Egalement pr^pards 
par recombinaison genetique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d'ADN recombinant, par insertion ou addition a la sequence d'ADN 

15 codant pour le polypeptide selon rinvention, d'lme sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison gdnetique sont bien connues de I'homme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews (50,512-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoide dipht^rique ou le toxoide 
t^tanique, les proteines derivees du Streptocoque (comme la prot^ine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
proteines de membranes extemes, les vesicules de membranes extemes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon rinvention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre sp^cifiquement les 
polypeptides selon rinvention. En effet, un polypeptide hybride selon I'invention 
permet la potentialisation de la reponse immunitaire, contre le polypeptide selon 
rinvention couple k la molecule immunog^ne. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
polypeptides selon rinvention, sont egalement objet de I'invention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la melhode 
classique de culture d'hybridome decrite par KQhler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon I'invention sont par exemple des anticorps chimeriques, dcs 
anticorps humanisms, des fragments Fab, ou F(ab')^ Us peuvent ^galement se presenter 
sous forme d'imm\inoconjugu6s ou d'anticorps marqu6s afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon ['invention peuvent fitre employes dans un proc&li 

pour la detection et/ou Tidentification de bacteries appartenant h Tespece Streptococcus 
agalactiae ou i un micro-organisme associe dans un echantillon biologique, caracteris^ 
en ce qu'il comprend les Stapes suivantes: 

a) mise en contact de T^chantillon biologique avec un anticorps selon IMnvention ; 

10 b) mise en Evidence du complexe antigene-anticorps 6ventuellement form6. 

Les anticorps selon la pr^sente invention sont egalement utilisables afin de 
detecter ime expression d'un g^ne de Streptococcus agalactiae ou de micro-organismes 
associ^s. En effet, la presence du produit d'expression d'un gene reconnu par un 
anticorps sp^cifique dudit produit d'expression pent etre detect6e par la presence d'un 

15 complexe antigene-anticorps form^ apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
rinvention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifiig^e, lysee, plac^e dans un reactif approprid pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de I'expression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apr^s une ^lectrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en I'absence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on d^tecte la presence de la 

25 prot^ine ou du polypeptide d'interfit, par mise en contact de ladite membrane avec un 
anticorps selon I'invention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en oeuvre d'un procede tel que decrit (de detection de Texpression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 I'identification de bacteries appartenant a I'espece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les Elements suivants : 

a) un anticorps polyclonal ou monoclonal selon I'invention ; 

b) eventuellement, les r^actifs pour la constitution du milieu propice a la reaction 
immunologique ; 
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c) ^ventuellement, les reactifs permettant la mise en Evidence des complexes antigtoe- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon Tinvention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce h prot^ines 
5 est un objet de Tinvention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirig6 contre un compost d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou filtres a haute density contenant des proteines selon 
10 rinvention peuvent etre construites de la meme mani^re que les puces a ADN selon 
rinvention. En pratique, on peut effectuer la synthese des polypeptides directement 
fix^s sur la puce a proteines, ou effectuer une synthase ex situ suivie d'une ^tape de 
fixation sur ladite puce du polypeptide synthetis^. Cette demifere methode est pr^fiSrable, 
lorsque Ton desire fixer des proteines de taille importante sur le support, ces proteines 
15 dtant avantageusement preparees par genie g^netique. Toutefois, si Ton ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proc^der k 
la synthase desdits peptides directement in situ, 

Les puces a proteines selon I'invention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou Tidentification de bact^ries 
20 assocites a I'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de fa9on plus gen^rale dans des kits ou necessaires pour la detection 
et/ou ridentification de micro-organismes. Lorsque Ton fixe les polypeptides selon 
rinvention sur les puces a ADN, on recherche la presence d'anticorps dans les 
dchantillons testes, la fixation d'un anticorps selon I'invention sur le support de la puce 
25 a proteines permettant 1' identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon I'invention sur le support de la puce k 
proteines, et on detecte la presence de I'antigene correspondant, specifique de 
Sirepiococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 

Une puce a proteines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de genes, pour etablir un profil d'expression desdits genes, en complement 
d'une puce a ADN selon I'invention. 

Les puces a proteines selon I'invention sont egalement extremement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes proteines 
d'un micro-organisme donnd. De fa9on simplifiee, on fixe des peptides representatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des protdines marquees, et apr^s une ^tape optionnelle de rin9age, on 
d6tecte des interactions entre lesdites proteines marquees et les peptides fix6s sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

rinvention ou un anticorps selon Tinvention sont objet de I'invention, ainsi que les kits 
ou n^cessaires les contenant. 

La presente invention couvre egalement un procede de detection et/ou 
dMdentification de bact^ries appartenant a Tespfece Streptococcus agalactiae CIP 82.45 
10 (ATCC 12403) ou i un micro-organisme associi dans un ^chantillon biologique, qui 
met en oeuvre une sequence nucleoli dique selon I'invention. 

II doit etre entendu que le terme 6chantillon biologique conceme dans la 
presente invention les dchantillons pr^lev6s a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres prdlev6s k partir d'un mammiftre) ou un 
15 ^chantillon contenant du materiel biologique, c'est-a-dire de I'ADN ou de TARN. Un 
tel ^chantillon biologique comprend aussi les compositions alimentaires contenant des 
bact^ries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique conceme aussi les bacteries isolees a partir de ces prelevements 
20 ou compositions alimentaires. 

Le procede de detection et/ou dMdentification mettant en oeuvre les sequences 
nucltotidiques selon T invention peut etre de diverse nature. 

On prefere un procede comportant les etapes suivantes : 

a) eventuellement, isolement de I'ADN a partir de r^chantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de TARN de T^chantiilon biologique ; 

b) amplification specifique de TADN de bacteries appartenant ^ Tespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe a Faide d'au 
moins une amorce selon I'invention ; 

c) mise en evidence des produits d'amplification. 

30 Ce procede est base sur Tamplification specifique de I'ADN, en particulier par 

une reaction d'amplification en chaTne. 

On prefere Egalement un procede comprenant les etapes suivantes : 
a) mise en contact d'une sonde nucl^otidique selon I'invention avec un echantillon 
biologique, Tacide nucl^ique contenu dans rechantiilon biologique ayant, le cas 
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^ch^ant, prdalablement 6X6 rendu accessible k Thybridation, dans des conditions 
pennettant Thybridation de la sonde a I'acide nucleique d'une bacterie appartenant a 
Tespdce Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associ6 ; 

5 b) mise en evidence de Thybride eventuellement form6 entre la sonde nucl^otidique et 
TADN de Techantillon biologique. 

Un tel procdd6 ne doit pas etre limits k la detection de la presence de TADN 
contenu dans rdchantillon biologique ^ tester, il peut etre egalement mis en oeuvre pour 
detecter TARN contenu dans ledit ^chantillon. Ce procdd6 englobe en particulier les 
10 Southern et Northern blot. 

Un autre procedd pr6f6r6 selon Tinvention comprend les Stapes suivantes : 

a) mise en contact d*une sonde nucl^otidique immobilis^e sur un support selon 
rinvention avec un ^chantillon biologique, I'acide nucleique de l'6chantillon, ayant, 
le cas ^chdant, 6x6 pr^alablement rendu accessible k Thybridation, dans des 

15 conditions permettant rhybridation de la sonde k Tacide nucleique d'une bacterie 
appartenant k TespSce Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou i un 
micro-organisme associ6 ; 

b) mise en contact de Thybride forme entre la sonde nucleotidique immobilis^e sur un 
support et I'acide nucleique contenu dans Techantillon biologique, le cas echeant 

20 apres elimination de TADN de Techantillon biologique n'ayant pas hybride avec la 
sonde, avec une sonde nucleotidique marquee selon Tinvention ; 

c) mise en evidence du nouvel hybride forme a I'etape b). 

Ce procede est avantageusement utilise avec une puce a ADN selon Tinvention, 

I'acide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
25 puce, et ^tant detect^ par Tutilisation d'une sonde marquee. Ce procede est 

avantageusement mis en ceuvre en combinant une etape prealable d' amplification de 

TADN ou de TADN complementaire obtenu Eventuellement par transcription inverse, a 

Taide d'amorces selon I'lnvention. 

Ainsi, la presente invention englobe dgalement les kits ou necessaires pour la 
30 detection el/ou ridentification de bacleries appartenant a I'espece Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 

qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Tinvention ; 
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b) eventuellement, les r^actifs n^cessaires k la mise en ceuvre d'une reaction 
d'hybridation ; 

c) Eventuellement, au moins une amorce selon rinvention ainsi que les r&ctifs 
nicessaires k une reaction d'amplification de I'ADN. 

5 De meme, la presente invention englobe Egalement les kits ou necessaires pour 

la detection et/ou Pidentification de bact^ries appartenant k Tespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou ^ un micro-organisme associE, caracterisE en ce 
qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon Tinvention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Tinvention ; 

c) eventuellement, au moins une amorce selon Tinvention ainsi que les r^actifs 
necessaires a une reaction d'amplification de I'ADN, 

Enfin, les kits ou necessaires pour la detection et/ou Tidentification de bact^ries 
appartenant k TespSce Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterisE en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon I'invention ; 

b) Eventuellement, les rEactifs necessaires pour effectuer une reaction d'amplificaticn 
d'ADN; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Pinvention, 

sont Egalement objet de la presente invention, 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les precedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de I'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De maniere preferee, ces elements sont choisis parmi les sdquences nucleotidiques 
codant pour une protEine secretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes associds contenant une 
ou plusieurs mutation(s) dans une sequence nucleotidique selon I'invention, en 
particulier une sequence ORF, ou leurs elements regulateurs (en particulier promoteurs). 
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On prefere, selon !a presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucldotidiques codant pour des polypeptides impliqu6s dans la machinerie cellulaire, en 
particulier la secretion, le m^tabolisme interm^diaire central, ie m^tabolisme 
5 energ^tique, les processus de synthase des acides amines, de transcription et de 
traduction, de synthase des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu*elles sont situdes dans les elements r^gulateurs dudit gtoe, k une surexpression 
de celui-ci. 

10 L'invention conceme en outre Tutilisation d'une sequence nucl^otidique selon 

rinvention, d'un polypeptide selon Tinvention, d'un anticorps selon Tinvention, d'une 
cellule selon Tinvention, et/ou d'un animal transforme selon Tinvention, pour la 
selection de compost organique ou inorganique capable de moduler, de r^guler, 
d'induire ou d*inhiber Texpression de genes, et/ou de modifier la replication cellulaire 

15 de cellules eucaryotes ou procaryotes ou capables dMnduire, d'inhiber ou d'aggraver 
ime pathologies liees k une infection par Streptococcus agalactiae ou un de ses micro- 
organismes associ^s, 

L*invention comprend egalement une m^thode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon Tinvenlion, capables 

20 de se lier a une sequence nucleotidique selon Finvention, ou capables de reconnaitre un 
anticorps selon Tinvention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
Texpression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologic liee a une infection par Streptococcus, 

25 par exemple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compost avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon T invention et/ou administration dudit compose a 
un animal transform^ selon I'invention ; 
30 b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler d'induire ou d'inhiber 
Texpression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transform^ les pathologies liees 
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a une infection par Streptococcus^ par exemple Streptococcus agalactiae ou un de ses 
micro-organismes assocife. 

Les cellules et/ou les animaux transform^s selon Tinvention, pourront 
avantageusement servir de modele et etre utilises dans des proc6d6s pour etudier, 
5 identifier et/ou s^lectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggrav^es par Streptococcus agalactiae^ ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules botes transform^es, 
notamment les bact^ries de la famille des Streptococcus dont la transformation par un 
vecteur selon Tinvention peut par exemple accroitre ou inhiber son pouvoir infectieux, 
10 ou moduler les pathologies habituellement induites ou aggrav6es par I'infection, 
pourront etre utilis^es pour infecter des animaux dont on suivra I'apparition des 
pathologies. Ces animaux non transform^s, infectes par exemple avec des bacteries 
Streptococcus transformdes, pourront servir de modele d'etude. De la meme mani^re, 
les animaux transformes selon IMnvention pourront etre utilises dans des proc^d6s de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues k 
Streptococcus, Lesdits proced6s utilisant lesdites cellules transform^es et/ou animaux 
transformds, font partie de T invention. 

Les composes susceptibles d'etre selectionnes peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques connus, ou des composes organiques nouveaux 
elabor^s a partir de techniques de modelisation mol^culaire et obtenus par synthase 
chimique ou biochimique, ces techniques etant connues de Thomme de I'art. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler I'infection par ces micro-organismes. Lesdits composes 
selon rinvention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de Thomme de Tart. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter el/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viabilite dudit micro- 
organisme. 



wo 02/092818 



36 



PCT/1B02/03059 



Cette modulation peut etre r^alisee par exemple par un agent capable de se Her k 
une proteine et ainsi d*inhiber ou de potentialiser son activity biologique, ou capable de 
se lier a une proteine membranaire de la surface ext^rieure d*un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule bote ou de favoriser 
5 Taction du syst^me immunitaire de Torganisme infecte dirig6 a Pencontre dudit micro- 
organisme. Cette modulation peut etre ^galement realis^e par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
- par exemple Texpression d'un polypeptide dont Tactivite biologique ou stnicturelle est 
necessaire a la croissance ou a la reproduction dudit micro-organisme. 

10 On entend designer par micro-organisme associ^ dans la pr&ente invention, tout 

micro-organisme dont Texpression de gene peut etre modul6e, regulde, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre ^galement modul^e 
par un compose de invention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucieotidiques ou des polypeptides selon Tinvention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucldotidiques 
identiques ou homologues a celles de Tinvention et pourront egalement etre detectes 
et/ou identifies par les proced^s ou kit de detection et/ou d'identification selon 
rinvention et egalement servir de cible pour les composes de invention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

L'invention conceme les composes susceptibles d'etre selectionnes par une 
mediode de selection selon Tinvention. 

LMnvention conceme egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon T invention ; 

b) lin polypeptide selon I'invention ; 

c) un vecteur selon Tinvention ; 

d) un anticorps selon T invention ; et 

30 e) un compose susceptible d'etre selectionne par une methode de selection selon 
rinvention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La pr&ente invention conceme en outre une composition pharmaceutique selon 
rinvention pour la prevention et le traitement d'une infection par line bact^rie 
appartenant k Tesp&ce Streptococcus agalactiae. 

La pr^sente invention conceme en outre une composition pharmaceutique selon 
5 rinvention, caract^riste en cc qu'elle comprend des anticorps dirigfe contre les 
polypeptides sp^cifiques de Streptococcus agalactiae. 

On entend designer par quantity efBcace, une quantity suflBsante dudit compost 
ou anticorps, ou de polypeptide de rinvention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d*un micro-organisme associe. 
10 L* invention conceme aussi une composition pharmaceutique selon rinvention 

pour la prevention ou le traitement d'une infection par une bact^rie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

L' invention vise en outre une composition immunogtoe et/ou vaccinale, 
caract6ris6e en ce qu'elle comprend un ou plusieurs polypeptides selon rinvention et/ou 
15 un ou plusieurs polypeptides hybrides selon rinvention. 

LMnvention comprend aussi rutilisation d*une cellule transformee selon 
rinvention, pour la preparation d'une composition vaccinale. 

LMnvention vise egalement une composition vaccinale, caracteris^e en ce qu'elle 
contient une sequence nucldotidique selon rinvention, un vecteur selon rinvention 
20 et/ou une cellule transformee selon I'invention. 

LMnvention conceme en outre une composition immunogfene capable d'induire 
une reponse Immunitaire celluiaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a Tespece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon I'invention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de Timmunite appropriis. 

L' invention conceme egalement les compositions vaccinales selon rinvention, 
pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

I'invention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions inrununogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant k une 
proteine, ou un de ses fragments, de I'enveloppe celluiaire de Streptococcus. Les 
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compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preftrence ^galement des sequences nucldotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une protelne, ou un de ses fragments, de Tenveloppe 
ccllvlaiTe dt Streptococcus. 
5 Les polypeptides de Tinvention ou leurs fragments entrant dans les compositions 

immunogenes selon Tinvention peuvent etre s^lectionnes par des techniques connues de 
rhomme de Tart comme par exemple sur la capacite desdits polypeptides 4 stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d'interleukines, ou qui aboutit k la production d'anticorps dirigfe contre lesdits 
10 polypeptides. 

Chez la souris, chez laquelle une dose pond^rale de la composition vaccinale 
comparable k la dose utilisee chez I'homme est administr^e, la reaction anticorps est 
testee par prelevement du s^rum suivi d'une ^tude de la formation d'un complexe entre 
les anticorps presents dans le s6rum et Tantigene de la composition vaccinale, selon les 

15 techniques usuelles. 

Selon rinvention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas ^ch^ant, avec un 
ou plusieurs adjuvants de Timmunite appropri^s. 

Aujourd'hui, divers types de vaccins sont disponibles pour protdger Thomme 

20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-orgamsmes inactives (virus de la grippe), des extraits 
aceilulaires {Bordetella pertussis pour la coqueluche), prot^ines recombin^es (antigene 
de surface du virus de I'hepatite B), des polyosides (pneumocoques). Des vaccins 
prepares k partir de peptides de synthese ou de micro-organismes genetiquement 

25 modifies exprimant des antigenes heterologues sont en cours d'experimentation. Plus 
recemment encore, des ADNs plasmidiques recombin6s portant des genes codant pour 
des antigenes protecteurs ont 6x€ proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se rdplique pas in vi\o et qui code uniquement pour la proteine vaccinante. 

30 Des animaux ont ete immunises en injecianl simplement I'ADN plasmidique nu dans le 
muscle. Cene technique conduit a Texpression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) el de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est Tun des principaux avantages de la 
technique de vaccination avec de TADN nu. 
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Les compositions vaccinales comprenant des sequences nucliotidiques ou des 
vecteurs dans lesquels sont ins^rees lesdites sequences, sent notamment d6crites dans la 
demande intemationale WO 90/11092 et ^galement dans la demande intemationalc 
N° WO 95/11307. 

5 La sequence nucl^otidique constitutive de la composition vaccinale selon 

rinvention peut fitre injectee k Thote apres avoir 6x6 couplee k des composes qui 
favorisent la penetration de ce polynucleotide i Tinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsulfe dans des 
microparticules polymeres, comme d^crit dans la demande intemationale N** WO 

1 0 94/2723 8 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
rinvention, la sequence nucieotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucieaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

15 cellules. Le polynucleotide ou le vecteur selon rinvention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement i la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande intemationale N** WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon rinvention, placee sous le controle d'eiements de regulation 
permettant son expression chez rhomme ou ranimal. On pourra par exemple utiliser, en 
tant que vecteur d'expression in vivo de I'antigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vehicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui permet par exemple la 
facilitation de Tadministration du compose actif, I'augmentaiion de sa duree de vie et/ou 
de son efficacite dans I'organisme, I'augmentation de sa solubilite en solution ou encore 
I'amelioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 
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bien connus et seront adapt^s par rhomme de Tart en fonction de la nature et du mode 
d'administration du compost actif choisi. 

En ce qui conceme les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de rimmunite appropries qui sont connus de ITiomme de Tart, comme par 
5 exemple ITiydroxyde d'aluminium, un repr^sentant de la famille des muramyl peptides 
comme un des derives peptidiques du N-acetyl-muramyl, un lysat bact^rien, ou encore 
Tadjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie systdmique, en 
particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- 
10 cutanee, ou par voie orale, De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides seion Tinvention, sera administr^e k plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d'administration, posologies et formes galdniques optimaux 
peuvent etre determines selon les crit^res gen^ralement pris en compte dans 
15 retablissement d'un traitement adapts k un patient comme par exemple Tage ou le 
poids corporel du patient, la gravite de son ^tat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, rinvention comprend I'utilisation d'une composition selon Tinvention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus, 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
g^nomique d'une bacterie du genre Streptococcus, de maniere preferee. Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en particulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre donees dans ladile banque, en raison de problemes 
de letalites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifiees par Thomme du mdtier, en utilisant des oligonucleotides specifiques des 
30 sequences des exiremites des differeniis clones qui formenl les contigs. 

La presente invention conceme egalement les m^thodes pour I'isolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN baste par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 



wo 02/0928 1 8 PCT/1 802/03059 

41 

La methode selon Tinvention pour IMsolement d*un polynucleotide d'interet peut 
comprendre les Stapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bact^rie StreptococcuSy 
ladite bact^rie Streptococcus appartenant a une souche differente de la souche 
utilis^e pour la construction de la banque d'ADN de I'etape a) ou, de fa9on 
alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare k 
partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d*ADN de retape a) ; 

c) hybrider le polynucleotide de retape a) au polynucleotide de I'etape b) ; 

d) seiectionner les polynucleotides de I'etape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de I'etape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de I'etape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de fa^on optionnelle, 
I'amplification de I'insert polynucleotide qui en resulte. 
20 Ainsi, la methode de I'invention permet a Thomme du metier d'effectuer des 

etudes genomiques comparatives entre les differentes souches ou especes du genre 
Streptococcus^ par exemple entre les souches pathogeniques et leurs equivalents non 
pathogenes. 

En particulier, il est possible d'etudier et de determiner les regions de 
25 polymorphisme entre lesdites souches. 

L*invention comprend aussi un precede d'identification de sequence specifique 
de Streptococcus agalactiae, caracterise par Talignement de sequences nucieotidiques 
de Streptococcus agalactiae selon Tinvention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

30 

La presente invention concerne egalemenl I'utilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence. 
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- pour le controle par Tintenn^diaire du quorum-sensing, 

- pour r identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour I'identification de cibles contre les bacteries Gram positives pathogenes 
5 par la mdthpde de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 

EXEMPLES 

Exemple 1 : Mat^riels et methode 

10 La strategic de sequen9age du genome de Streptococcus agalactiae CIP 82,45 

(ATCC 12403) repose sur un s6quen?age alleatoire (shot-gun). La premiere ^tape de ce 
travail consiste ^ doner TADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAG). 
Materiels et methodes. 

15 1 . Construction des banques : 

a/ Banque de petits fragments dans le vecteur pcDNA2.1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement i 
la proteinase K et une extraction au phenol (9). Environ 10 ng d'ADN ont ix6 cassis par 

20 nebulisation (1 minute sous une pression de 1 bar) (4). Les extremit^s des fragments 
d*ADN ont ete rendues Tranches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzymc a 
€ii inactiv^e par une incubation de 15 mn a 75''C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 d'ADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont it6 
purifies apres dlectrophorese sur gel d'agaiose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete dig6re par I'enzyme BstXl et purifi6 par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4. Le 

30 melange de ligation a ete introduil par transformaiion dans la souche &Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par \x\ du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
d^pos^e a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evdnements de co-ligation et de clones 
sans insert, la mdthode du remplissage partiel du site de coupure a €t6 utilis^e (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a €Xi diger6 de mani^re partielle par renzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de Tenzyme. La fraction pr^sentant la gamme 
de tailles souhaitte (entre 2 et 12 kbases) a ete precipit^e et les extr6mit6s ont iXi 
remplies partiellement par le fragment de Klenow de la DNA polymerase d!E. coli en 
presence de dTTP et dCTP. AprSs purification sur gel d'agarose les fi-agments d'ADN 
chromosomique ayant une taille comprise entre 3 et 6 kbases ont m ligu6s au vecteur 

10 pSYX34 (7) dig^r^ par I'enzyme Sail remplie partiellement par Tenzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche Escherichia coli XLlO-kan (Stratagene) et ^talement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/1. Environ 500 colonies 
sont obtenues par pi du melange de ligation. 

15 2. Preparation des plasmides et s6quen9age 

Les plasmides ont cXi prepares par une m^thode semi-automatique de 
preparation developpee au laboratoire GMP bas^ sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du foumisseur (PE- 

20 biosystems). Les sequences ont etd determinees en utilisant un sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 

Les sequences ont ixi assemblies en utilisant Tensemble de logiciel 
developpe a TUniversite de Washington, Phred, Phrap et Consed (5, 8). La finition de la 

25 sequence a ete realisie en utilisant Tensemble de logiciel GMPTB (7). L'etape de 
finition correspond au resequen9age des regions ou la sequence est peu sure et le 
s6quen9age des regions situees entre les contigs. Elle a ete realisee en siquenfant des 
produits de PCR correspondant a ces regions identifiees par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete definies 

30 en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 

^identification des phases codantes (CDS) a ete realisee en utilisant 
Tensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les r6sultats de difTerentes methodes : (i) Tidentification de phases ouvertes de lecture et 
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leur tri en fonction de leur taille, (ii) Tanalyse de la probability d'etre codante en utilisant 
le iogiciel Genemark (11), (iii) Tidentification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarity de la sequence proteique 
d^duite avec les sequences prot^iques contenues dans les banques de sequence en 
5 utilisant le Iogiciel BLASTP. 

Les fonctions des proteines cod^es par les phases codantes identifi^es 
indiqu^es au tableau 1 ont 6i6 pr^dites par Tanalyse des r^sultats de recherche de 
similaritys dans les banques en utilisant le Iogiciel BLASTP (1). 
Exemple 2 : Description scientifique de la banque de BAC de Streptococcus agalactiae 
10 CIP 82.45 (ATCC 12403) ddpos^e k la CNCM le 28 decembre 2000 sous le numero I- 
2610. 

Collection de clones d' Escherichia coli DH lOB"^ (Calvin et al., J. Bacteriol. 
170, 2796, 1988) contenant des fragments d'ADN gdnomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

15 vecteur pSYX34 (Xu et al., Biotechniques, 17:57, 1990). Le vecteur a iii digere Sail et 
partiellement rempli a Taide de TADN polymerase afin de produire des extremites 
5'-TC. Des fragments g^nomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont iii diger^s partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5'-GA. Apres 

20 ligature irt vitro et transformation, des clones resistant au chloromphenicol ont etc 
s61ectionn6s. Environ 5000 clones ont iii assembles, suspendus dans 15 ml de milieu L 
et congel^s. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM316 

Les proteines de surface des bact^ries pathogenes, et plus particulierement les 

25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notanmient 
des interactions entre le microorganisme et les cellules de Thote et/ou Techappement au 
systeme immunitaire, Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularity d'etre li^es covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase- transpeptidase) appelee sortase. Uetude du role de ces 
proteines dans la virulence de S. agalactiae a iii realisee par 2 approches 
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complementaires (construction d'un mutant sortase-dificient, inactivation des gftnes 

codant pour des proteines de type LPXTG). 

- Le g^ne srtA de S. agalactiae NEM316 (IPF N»1268). 

Le mutant MEM1979, d6pos6 le 24 avril 2002 la CNCM sous le numdro I- 
5 2861, est une souche mutante derivde de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle I'lPF 1268 a €t€ inactive. 

L'analyse du gdnome de NEM316 nous a permis de caracteriser un gene srtA 
prdsentant homologie respectivement 55 % et 30 % d'identit^ avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a €ti inactive par 
1 0 insertion-inactivation et nous avons montr6 que le mutant ainsi constmit n'adhdrait plus 
a des cellules ^pithdliales humaines pulmonaires (A549) et ut6rines (HeLa). Ces 
rdsultats sugg^rent que les prot^nes du type LPXTG de S. agalactiae jouent un idle 
dans la virulence de cette bact^rie, en permettant notamment son adhesion avec les 
cellules de I'hote. 

1 5 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 16. 

Une analyse in silico du genome de NEM316 a r6v^l^ la pr&ence de 30 
proteines de surface putatives poss^dant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons itud\€ par amplification PGR, en utilisant des amorces specifiques, la 
distribution des genes codant pour 21 proteines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'hemoculture ou de mdningite). Cette etude a montr6 que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient prdsents dans toutes les souches de 
notre 6chantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont 6t€ 

25 inactiv^s par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminu^e avec les cellules ^pith^liales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivde de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle I'IPF 678 a 6x6 inactive. 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numdro I- 

2863, est une souche mutante d^rivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle I'IPF 1503 a €t6 inactive. 
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- Cibles vaccinales. 

La presence des gfines IPF N^1503, 678, 2192, 1861, 584, 280 chez toutes les 
souches de S. agalactiae testees font des prot^ines correspondantes des cibles vaccinales 
de choix pour le d^veloppement d*un vaccin anti-S. agalactiae. 

5 

TABLEAU 1 : Liste des phases codantes annotees identifiees par Tanalyse des 
sequences des contigs 
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TABLEAU 2 , Prot^ines de surface de Streptococcus agalactiae 





SEQID 


N«IPF 


Motif 
LPXTG 


% identity/ similitude 


1 


886 


18 


LPHTG 


24/37 : Sec (Surface exclusion proteine^ Kfaecalis 


2 


386 


1250 


LPSTG 


22/40 :Secl0 (Sur&ce exclusion proteine) 
Enterococcus faecalis plasmid pCFl 0 


3 


1669 


280 


LPKTG 


50/65 : pullulanase 5. pneumomae 


4 


1895 


523 


LPATG 


90/91 : alpha like proteine S. agalactiae 


5 


806 


1716 


LPSTG 


3 1/46 : M-like proteine S. equi 


6 


1183 


2140 


LPLTG 


36/60 : cell-division protein homolog ywcF B, subtilis 
34/56 : stage V sporulation^rotein E B. haloduram 


7 


1346 


2337 


LPKTG 


25/38 : Unknown B. haloduram 


8 


1942 


571 


LPSTG 


50/60 : Hemagglutinine S, gordonii 


9 


2129 


765 


LPNTG 


28/43 : sdrc 5. aureus 


10. 


2046 


678 


LPKTG 


SIIIQ : putative cyclo-nucleotide phosphodiesterase 
Strep, dysgalactiae susp. equismilis 


11 


618 < 


1503 


LPKTG 


49/65 : celle envelope proteinase S, thermophilus 


12- 


1227 


220 


LPSTG 


30/43 : SspB (adhesion) S, gordonii 


13; 


1954 : 


584 


LPKTG 


26/48 : hypothetical serine riche repeat prot S. pombe 


14, 


1493 . 


2495 


LPKTG 


23/47 : gene drosophile 


15 


1955 


585 


Ll»KTG 


30/46 : 6-aminbhexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S. sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 


17 


LPKTG 


30 /47 : hypothetical proteine iota de 5. pyogenes 
plasmid pDB 101 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasmid pDBlOl 


22 


1418 


2414 


LPSTG 


33/47 : orfC Kfaecalis, plasmid pAM-beta -1 


Autres prot^ines possibles OPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B, Halodurans 
29/41 : fimbrial S\} Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


24' 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein I S. pyogenes 
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la sequence q6nomique complete StQ ID N''Z345 
Fonctions Pr6dltes" 


similar to glutamyl-aminopeptidase and/or to encio-i,4-Deta- 
glucanase 


Unknown 1 


similar to unknown protein | 


similar to thioredoxin HI 


weakly similar to phenylalanyl-tRNA synthetase (beta subunit) 


similar to unknown proteins 


Similar to single-strand binding protein 1 


Similar to ABC transporter (ATP-binding protein) j 


similar to unknown proteins 


Similar to two-component sensor histidine kinase 


Similar to two-component response regulator 


[Similar to unknown proteins 


[similar to unknown proteins 


1 Similar to (oligopeptide) ABC transporter (Oinaing protein) i 


Similar to oligopeptide ABC transporter (permease) 


Isimilar to phosphatidylglycerophosphate synthase 


1 213972-214793 p 'Similar to ABC transporter (permease; i 


iSimilar to oligopeptide ABC transporter (ATP-binding protein) 


ISimilar to oligopeptide ABC transporter (ATP-oinaing protein) 


1 Hypothetical protein 


Isimilar to unknown protein 


Isimilar to unknown protein 


jsimilar to transcription-repair coupling factor 


Isimilar to peptldyl-tRNA hydrolase 


Isimilar to unknown proteins 


Isimilar to hypothetical GTP binding protein 


1 Hypothetical protein 


Isimilar to unknown protein • I 


\ similar to putative transcnption regulator 


Ibeta subunit of DNA polymerase 111 1 


Jentif!6es par I'analyse de 

Positions / Sens 
(psplus, m=mlnus) 1 


202238-203305 m \ 


203490-203729 m |l 


203890-204174 p \\ 


204171-204494 p | 


204627-205153 p 


205207-205923 m 1 


206004-206399 p | 


2190539-2191378 m | 


206522-207166 p 1 


207193-208938 p j 


1 208919-209659 p | 


1 209829-210264 p | 


1 210286-211014 p | 


: 211257-212885 p | 


t 212998-213975 p 


1 2191378-2191917 m 


1 214805-215608 p 


cx 

00 

T— 

CM 
CD 

^ 

CM 
C7> 

in 
in 

CM 


! 10743-10877 p 


1 10369-10740 p 


1 10110-10382 p 


1 6322-9819 p 


! 5750-6325 p 


1 2192043-2193326 m 


cx 

CD 
(D 

in 

in 
in 


t 4188-4391 p 


1 3789-3986 p 


1 2898-3779 p 


1692-2828 p 


dantes annot6es c 
Prot§lne . 


SA-1 000.1 


SA-100t.l 1 


SA-1 002.1 


SA-1003.1 1 


SA-1 004.1 


SA-1006.1 1 


SA-1 007.1 


SA-101.1 1 


SA-1 01 0.1 1 


SA-1012.1 1 


SA-1013.1 1 


SA-1016.1 1 


1 SA-1017.1 1 


1 SA-1018.1 


SA-1 01 9.1 


1 SA-1 02.1 


i SA-1020.1 


1 SA-1021.1 


1 SA-1022.2 


SA-1 024.2 


SA-1 025.2 


SA-1026.1 


1 SA-1028.1 


SA-1029.1 


SA-1 03.1 


1 SA-1 030.1 


SA-1031.1 


1 SA-1032.1 


SA-1033.1 


SA-1 034.1^ 


IS phases co 
Anciens 
SEQ ID 

(Prot6lne) 
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replication initiation protein DnaA 1 


similar to chromosome partitioning protein ParB 


Similar to serine protease 


similar to unknown protein 


similar to unknown transmembrane protein 


similar to unknown proteins 


similar to ABC transporter (ATP-bindinq protein) 


similar to unknown proteins 


similar to thiamine-phosphate pvrophosohorvlase (ThiE) 


Similar to UDP-N-acetylglucosamine 1-carboxyvinvltransferase 


Similar to acetyl transferase 


Similar to unknown proteins 


simitar to methionine aminopeptidase 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to DNA ligase 


similar to unknown proteins 


Similar to pullulanase 


similar to 1.4-alpha-glucan branching enzyme 


Similar to glucose-1 -phosphate adehylyltransferase 


similar to glucose-1 -phosphate adenylyltransferase 


simitar to glycogen synthase I 


Similar to recombination protein RecF ; 


similar to xanthine permease 


similar to nitrite or formate transporter 


similar to unknown protein (N-terminal part) 


Uniknown. similar to unknown protein 


similar to other protein (putative thiamine biosynthesis 
lipoprotein) 


similar to 4-oxalocrotonate tautomerase 


thymidine kinase 


peptide chain release factor 1 


putative transmembrane protein similar to unknown protein | 


a. 

CO 

i 


2217128-2217901 p 1 


2216801-2217030 p | 


2215121-22156d0m | 


2211963-2214542 p 1 


-E 

CM 
tv 
in 

00 

CO 
CO 
Oi 

T— 
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895372-696232 p I 


Ql 
CJ> 

?? 

CM 

CO 
ay 
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Ol 
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in 

T— 

<v 

00 

r— 
CM 


897171-897626 m I 


CX 

CO 
00 
CD 

<? 
00 

o 

00 

Oi 
00 


898457-90Q415 p | 


900427-901446 p | 


901450-903750 p 1 


903956-905824 p 


905866-907005 p i 


906995-908128 p 1 


908125-909555 p ! 


2195167-2196276 p 


1167875-1169149 m 


1166988-1 167776 p 


i 1165654-1166889 p 


1165028-1165630 p 


O 

■ O 

to 

CO 

- ^ 
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Q. 
CO 

ay 

CO 
CD 

h- 

CO 
CO 


1163034r1 163603 m 


1161920-1 162999 m 


2196288-2197154 m 


SA-1 035.2 f 


SA.1036.2 1 


SA-1037.1 1 


SA-1038.1 1 


a> 

CO 

o 

CO 


SA-104.1 1 


SA-1041.1 1 


SA.1042.4^ 1 


SA-1044.2 1 


SA-1 045.1 


SA-1046.1 ! 


SA-1 047.1 1 


SA.1048.1 1 


SA-1 049.1 1 


SA-105.1 1 


SA-1050.1 1 


SA-1051.1 


SA-1053.1 1 


SA-1 054.1 1 


SA-1055.1 1 


SA-1 056.1 1 


SA.1057.1 1 


SA-1058.1 1 


SA-1 059.2 


SA-106.1 1 


SA-1 062.2 


SA-1063.1 


1 SA-1064.1 


1 SA-1065.1 


SA-1066.1 


1 SA.1067.1 


SA-1068.1 


1 SA-1 069.1 


i SA-107.1 


;5 


in 


CD 
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CM 
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CN 


§ 

CM 


2376 1 


2377 1 


2378 1 


2379 1 


2380 1 


2381 


2382 


2383 


2384 1 


2385 


2386 : 


2387 1 


2388 


2389 


2390 1 


2391 1 


2392 1 


2393 


2394 1 


2395 1 


2396 1 


2397 1 


2398 


2399 


1 2400 


2401 


1 2402 


1 2403 


1 2404 


2405 


2406 


1 2407 


2408 


2409 


DnM512 1 
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jimilar to protoporphyrinogen oxidase 1 


similar to unknown protein 1 


serine hydroxymethyitransferase I 


similar to unknciwn protein | 


similar to unknown protein 1 


similar to ABC transporter (ATP-bincJing protein) | 


similar to-ABe-transporter (ATP-binding protein) 1 


Unknown 1 


Similar to phosphoglucomutase I 


similar to transcriptional regulator 1 


similar to unknown protein I 


1 1 50837-1 1 51 379 p isimilar to pantothenate metabolism flavoprotein 1 


similar to flavoprotein 1 


similar to unknown protein 1 


similar to NADH-dependent oxidoreductase 1 


similar to unknown protein 1 


similar to glycine cleavage system H protein 


similar to unknown protein 1 


Similar to cellobiose-specific PTS enzyme IlC 


Similar to cellobiose-specific PTS enzyme IIB 


similar to inosine monophosphate dehydrogenase 


Similar to cellobiose-specific PTS enzyme IIA 


similar to hypothetical transcriptional regulator 


Isimilar to transcriptional regulator (DeoR family) 


Isimilar to pyruvate formate-lyase activating enzyme 1 


Isimilar to general stress protein GSP1 3 


1 C-termlnal part similar to peptidyl-prolyl cis-trans isomerase 


[Similar to two-component response regulator 


ISimilar to two-component sensor histidine kinase 


Isimilar to unknown proteins 


Isimilar to plasmid proteins 


isimilar to arginine repressor (ArgR) 


Similar to hypothetical protein kinases 


Isimilar to other proteins 


Isimilar to RNA-binciing protein Sun 


1 methionyl tRNA formyltransferase 1 


1161090-1161920 m |5 


116050M161097m \i 


1159153-1160409 m \\ 


1158171-1159148 m |i 


1157567-1158169 m |i 


1155834-1157555 m |! 


SA-1077.1 ! 1154100-1155833 m | 


SA-1 078.2 1153889-1154086 m | 


1152107-1153825 p | 


2197210-2197872 m | 


1151425-1151997 p J 


1150158-1150844 p | 


1149168-1150004 m | 


1147976-1149175 m | 


1146993-1147979 m | 


1146632-1146964 m | 


1145821-1146639 m | 


346400-347701 p 


346078-346398 p | 


2197947-2199428 m 


1 345738-346061 p 


1 344551-345534 p 


i 343677-344432 p 


1 342780-343556 m 


1 342377-342733 p 


1 340975-342375 p 


1 340292-340933 p 


339280-340299 p 


338588-339283 p 


1 1031773-1034922 m 


1 2199585-2200070 m 


336474-338429 p 


1 335737-336474 p 


1 334377-335699 p 


1 333452-334387 p 


SA-1071.1 r 


SA-1072.1 1 


SA-1073.1 1 


" SA-1074.1 1 


SA-1075.1 1 


SA-1076.1 1 


SA-1 079.1 1 


SA-1 08.1 1 


SA-1 080.1 1 


SA-1081.1 1 


SA-1082.1 1 


SA-1083.1 1 


SA-1084.1 i 


m 
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SA-1086.1 1 


SA-1087.2 1 


SA-1 088.2 1 


SA-1 089.1 ! 


SA-1 09.1 


SA-1 090.1 


1 SA-1 091 .2 


1 SA-1092.2 


1 SA-1093.1 


i 
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i 


1 SA-1 095.1 


1 SA-1096.1 


1 SA-1097.1 


1 SA-1098.1 
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1 SA-1 10.1 
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Similar to (3R)-hydroxymyristoyKacyl carrier protein) 
jehydratase 


similar to acyl carrier protein 1 


similar to 3-oxoacyKacyl-cianier pi^tein) reductase 1 


weakly similar to malonyl-CoArAcyl carrier protein transacylase 


Unknown . . - . 1 


Similar to transcriptional regulator (FNR/CRP family) 1 


Similar to X-proIyl dipeptidyl aminopeptidase 


Similar to unknown proteins 1 


Similar to heptaprenyl diphosphate synthase component II j 


Similar to cytochrome D ABC transporter ATP binding and 
permease protein 


Similar to cytochrome D ABC transporter (ATP binding and 
pennease protein) 


Similar to cytochrome bd ubiquinol oxidase (subunit II) 


Similar to cytochrome bd ubiquinol oxidase (subunit 1) 1 


Similar to hypothetical NADH dehydrogenase 


Similar to hypothetical menaquinone biosynthesis protein MenA 


Unknown 


Unknown 


similar to immunogenic secreted protein precursor (C-terminal 
part) 


similar to immunogenic secreted protein precursor (internal part) 


1 Unknown 


1 similar to unknown protein 


1 similar to other protein 1 


i Unknown 


1 similar to unknown protein 


Unknown 


Isimilar to unknown protein 


Iweakly similar to DNA-translocase 


{Unknown 


Isimilar to unknown protein 1 


670104-670580 p ( 


669815-670120 p |J 


669100-669822 p |! 


668255-669103 p !^ 


667950-668255 p | 


1846687-1847346 p | 


1847370-1849655 p | 


1849659-1850018 p 1 


1850064-1851044 p | 


1851129-1852877 m 


1852870-1854588 m | 


1854588-1855607 ml 


1855608-1857035 m | 
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similar to unknown protein 1 


Unknown 


similar to unknown protein 


similar to 5-keto-D-gluconate 5-recJuctase 


Similar to sugar-phosphate isomerase 


similar to 2-keto-3-deoxyQtuconate kinase 


similar to 2-dehydro-3-deoxyphosphogluconate aWolase- 


Unknown 


similar to unknown protein 


similar to transcription regulator {MarR family) 


DNA polymerase III (alpha subunit) 


similar to pepticJoglycan hydrolase 


prolyl-tRNA synthetase 


similar to other protein 


Similar to phosphatldate cytidyiyltransferase (CDP-diglyceride 
synthase) 


similar to undecaprenyl pyrophosphate synthetase 


similaer to hypothetical permeases 


similar to 6-phospho-beta-glucosidase I 


similar to other proteins 


similar to unknown protein 1 


similar to transcriptional regulator (AraC/XylS family) I 


similar to putative channel transporter j 


Unknown j 


similar to spermidine/putrescine ABC transporter (binding 
1 protein) 


Isimilar to spermidine/putrescine ABC transporter (permease) | 


Isimilar to spermidine/putrescine ABC transporter (permease) | 


similar to spermidine/putrescine ABC transporter (ATP-binding 
protein) 


Isimilar to UDP-N-acetylenolpyruvoylglucosamine reductase | 


Isimilar to hydroxymethylpterin pyrophosphokinase | 


[similar to dihydroneopterin aldolase j 


Isimilar to dihydropteroate synthase I 


Isimilar to Integrase | 


1 similar to GTP cyclohydrolase I 
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similar to folyl-polyglutamate synthetase 1 


similar to unknown protein 


Similar to homoserine kinase 1 


similar to homoserine dehydrogenase 1 


Similar to nickel ABC transporter (binding protein) 


Similar to nickel ABC transporter (permease) 1 


Similar to oligopeptide and nickel ABC transporter (permease) 


similar to unknown proteins 1 


Similar to oligopeptide ABC transporter (ATP-binding protein) | 


Similar to oligopeptide or nickel ABC transporter (ATP-binding 
protein) 


uridylate kinase 1 


ribosome recycling factor 


similar to unknown proteins 


Isimilar to peptide methionine sulfoxide reductase 1 


similar to unknown proteins 


similar to myosin-crossreactive streptococcal antigen (unknown 
function) 


similar to phosphate starvation inducible protein, unknown 
function 


[Unknown 


Isimilar to two-component sensor hlstldlne kinase i 


isimilar to two-component response regulator (PhoB) 


iSimilar to transcriptional regulator PhoU 


Isimilar to phosphate ABC transporter (ATP-binding protein) 


Isimilar to phosphate ABC transporter (permease) 


Isimilar to phosphate ABC transporter (permease) 


Isimilar to phosphate ABC transporter (binding protein) 


similar to single-strand binding protein 

eimilartn ronliratinn nrntpin ^nlasmid^ 


Unknown 
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isimilar to ribosomal protein L1 1 methyltransterase 
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Similar to unknown proteins 1 


Similar to unknown proteins 


Unknown 


Unknown 


Similar to unknown proteins 1 


similar to xylulose-5-phosphate/fruGtose-6-phosphate 
phosphoketolase 


Similar to unknown proteins 


Weakly similar to transcriptional regulator (antltenminator) 


similar to unknown proteins 


similar to L-xylulose kinase 


Unknown 


Similar to galactitol-specific PTS enzyme IIC 


similar to glycerate ciehydrogenase 


Unknown 


similar to undecaprenol kinase 1 


similar to competence negative regulator mecA I 


weakly similar to DNA translocase 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 


similar to ABC transporter (ATP-binding protein) | 


similar to unknown protein 1 


similar to aminotransferase, putative cysteine desulfurase I 


similar to NifU protein 1 


similar to unknown protein | 


similar to serine-type D-Ata-D-Ala carboxypeptidase (penicilin 
binding protein) 


similar to serine-type D-Ala-D-Ala c^arboxypeptidase (penicilin 
binding protein) 


50S ribosomal protein L31 I 


jsimilar to metal ABC transporter (binding protein) I 


1 Unknown | 


Isimilar to dipeptidase | 


Similar to unknown proteins | 


{Similar to unknown proteins | 


Similar to unknown proteins | 
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Similar to unknown proteins 1 


Similar to purine nucleoside hydrolase 


Similar to unknown proteins 1 


asparaginyl-tRNA synthetase 1 


similar to unknown proteins | 


similar to aspartate aminotransferase I 


similar to ATP-dependent DNA helicase - \ 


Similar to meso-2,3-butanediol dehydrogenase (D-acetoln 
forming) 


similar to gamma-glutamylcystelne synthetase (for the 

N terminal part) and to cyanophycinsynthetase (C-termlnal part) 


Similar to unknown proteins I 


Unknown 1 


Similar to transcriptional regulators and to PTS enzyme 11 I 


Similar to adenylosuccinate synthase 


Unknown 


Similar to unknown protein 


Putative PTS enzyme IIC 


Similar to mannitol-specific PTS enzyme MB 


similar to mannitol-specific PTS enzyme IIA 


[Similar to hexulose-6-phosphate synthase 1 


Isimllar to putative acetyl transferase 


iSlmilar to hexulose-6-phosphate isomerase 


[Similar to L-rlbulose-5-phosphate 4-epimerase 


Isimilar to hypothetical transaldolase 1 


: Unknown 
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iSimllar to unknown proteins 
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ISimllar to the putative sigma factor ComXI 1 


Isimilar to putative acetyl transferase 


1 Similar to phosphoglycerate mutase 


iSimilar to D.D-carboxypeptidase 


1 Similar to N-acetyl muramidase 1 
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Similar to transcription repressor of class 1 heat-shock (HrcA) 


Similar to heat shock protein GrpE 


Chaperone protein DnaK 


Chaperone protein DnaJ 


similar to unknown protein 


ribosomal protein L11 • — 


similar to transmembrane efflux pump protein 


similar to hypothetical N-acyl-L-amino acid amidohydrolase 


similar to transcriptional regulator (LysR family) 


similar to unknown, proteins 


similar to para-amihobenzoate synthase, component 1 


Similar to DNA translocase 


similar to peptidyl-prolyl cis-trans Isomerase 


similar to surface ant'gen proteins, putative peptidoglycan bound 
1 protein (LPXTG motif) 


similar to unknown proteins 


similar to metal ABC transporter (permease) 


similar to metal ABC transporter (ATP-binding protein) I 


similar to metal ABC transporter (binding protein) 1 


similar to C5A peptidase, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to two-component response regulator | 


similar to two-component sensor histidine kinase 1 
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similar to glycerol dehydrogenase 1 
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Isimilar to transcriptional regulator (TetR/AcrR family) j 


similar to fonnate acetyltransferase I 
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similar to unknown proteins 1 


similar to branched-chaln-amino-acid aminotransferase 1 


Similar to topoisomerase IV subunit A 


similar to DNA topoisomerase IV (subunit B) I 


Similar to unknown proteins I 


Uracil DNA glycosylase 1 


similar to unknown proteins I 


CMP-N-acetylneuraminic acid synthetase I 


Similar to ABC transporter (pemnease) 1 


similar to giycosylation or acetylation protein 1 
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similar to N-acetylneuraminic acid synthetase 1 


capsular polysaccharide repeat unit transporter 1 


Similar to ABC transporter (ATP-binding protein) 


putative ABC transporter (permease) 1 


similar to unknown transmembrane protein I 


similar to acetyltransferase (chloramphenicol ?) | 


Unknown 1 


similar to cation-transporting P-ATPase 1 


similar to peptide methionine sulfoxide reductase 
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jweakly similar to histidine triad protein, putative lipoprotein 1 


1 1 ,2 Transport/binding proteins and lipoproteins 1 
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Isimilar to putative surface protein (sortase) 
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Similar to unknown proteins | 


Similar to Ribonuclease HII 


similar to unknown proteins 


Similar to signal peptidase 1 


Similar to putative exodeoxyribonuclease V 


Similar to unknown proteins 


Similar to DNA-damage-inducible orotein P 


Similar to Pyruvate formaterlyase 


Similar to FMN-binding protein ^ 


1841061-1841990 m :Similar to unknown proteins 1 


Similar to C3-degrading proteinase 


Similar to unknown protein 


[Similar to glycerol uptake facilitator 


Similar to unknown protein 


Similar to efflux protein 


Isimilar to ABC transporter (permease) 


Isimilar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) 


Isimilar to other proteins I 


isimilar to unknown proteins 


Isimilar to transposase 


Isimilar to transposase 


Isimilar to transposase 


Isimilar to insertion elemant protein j 


Isimilar to integrase C-terminal part (tmncated) 1 


1 ribosomal protein LI 9 


Isimilar to unknown proteins 


Isimilar to other proteins | 


[similar to N-acetylglucosamine-6-phosphate deacetylase 1 


Isimilar to flavodoxin | 


1 614783-615805 p similar to adenosine deaminase 1 


isimilar to unknown proteins 


|30S ribosomal protein S14 j 


Isimilar to low specificity L-threonine aldolase 1 


Similar to other proteins (includin putative glycoprotein 
endopeptldase) 
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similar to unknown protein I 


Jnknon, similar to unknown protein j 


similar to unknown protein (transmembrane) j 


similar to ABC transporter (ATP-binding protein) 1 


similar to transcription regulator (N-terminai part) | 


similar to unknown protein I 


similar to unknown protein I 


similar to unknown protein I 


similar to unknown transmembrane protein j 


similar to unknown protein | 


CAMP factor j 


similar to unknown proteins | 


1436804-1437127 m jUnknown I 


similar to unknown proteins j 


Unknown I 


similar to unknown proteins 1 


Similar to fructose-specific PTS enzyme IIABC 1 


similar to Fructbse-1 -phosphate kinase I 


similar to transcription repressor of fmctose operon FruR I 


Unknown 1 


similar to to Cell Wail Muropeptide Branching Enzyme j 


similar to cell wall proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to 2-dehydropantoate 2-reductase 


1 833223-834167 p Similar to transcriptional regulator (Lad family) | 


jsimilar to esterase 


ISlmilar to unknown proteins 


[Similar to unknown proteins 


1 manganese-dependent superoxide dismutase 


[Similar to transcription antiterminator 


ISimilar to beta-glucoside-specific PTS enzyme IIABC 


1 similar to oligopeptide ABC transporter (ATP-binding protein) 


Isimllar to oligopeptide ABC transporter (ATP-binding protein) 


Isimllar to oligopeptide ABC transporter (permease) 


Isimilar to oligopeptide ABC transporter (permease) 


Isimilar to oligopeptide ABC transporter (binding protein) | 


2061393-2061728 m 1? 


2062250-2062738 m 11 


2062907-2063668 m Ij 


2063665-2064567-m \\ 


2064772-2065848 m ji 


2066097-2066711 m j: 


SA-1843.1 i 2066925-2067221 p | 


2067238-2067798 p | 


2068103-2068966 p | 


2069123-2069425 m | 


2069598-2070365 m | 


1470405-1471253 m | 


1471263-1471633 m \ 


1471705-1472232 m | 


1472289-1472783 m | 


1472972-1474936 m | 


1474933-1475844 m | 


1475841-1476650 m | 


1435996-1436646 m | 


1476715-1477950 m ! 


1478094-1479725 m 


1 1479940-1480863 m 


1 834226-835218 m 


1 835394-836122 p 


1 SA-1 869.1 836176-837213 p 


i 837293-837901 p 
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o 

CD 
CO 
00 
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a> 

CO 
CM 
00 
CO 
GO 


1 839083-840951 p 


1 170247-171179 p 


1 169201-170247 p 


1 168157-169188 p 


1 167233-168147 p 


CL 

to 

1 

o> 
in 

CO 


SA-1837.1 r 


SA-1838.1 1 


SA-1839.1 1 


SA-1 840.1 1 


SA-1 841.1 1 


SA-1 842.1 ' 


SA-1844.1 i 


SA-1845.1 1 


SA-1 846.1 1 


SA-1 847.2 1 


932 ' SA-1 849.1 | 


SA-1 85.1 1 


SA-1850.1 1 


SA-1851.1 1 


SA-1852.1 ! 


SA-1855.1 i 


SA-1858.1 1 


ai 
in 

CO 

i 


SA-186.1 1 


SA-1860.1 


! SA-1861.1 


1 SA-1 862.1 


i SA-1866.2 


1 SA-1 867.1 


1 SA.1868.1 


1 SA-1870.1 


1 SA-1871.1 


1 SA-1872.2 


1 SA-1874.1 


1 SA-1875.1 


1 SA-1 876.1 


1 SA-1878.1 
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3077 1 
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3081 1 


3082 1 


3083 1 


3084 1 


3085 1 


ISEQ ID n** 5222 ! 3086 1 


3087 1 


3088 1 


3089 1 


3090 1 


3091 1 


3092 1 


3093 I 


3094 


3095 1 


3096 


3097 


3098 


3099 


3100 


3101 


3102 


1 3103 


3104 


3105 


3106 


3107 


3108 


3109 


3110 


3111 


ISEQ ID n' 5213 I 


SEQ ID n*» 5214 1 


SEQ ID n" 5215 


SEQ ID n** 5216 


SEQ ID n** 5217 


ISEQ ID n** 5218 | 


ISEQ ID n*^ 5219 1 


ISEQ ID n' 5220 _| 


ISEQ ID n' 5221 i 


ISEQ ID n° 5223 | 


CM 
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Unknown I 


[^haperonin GroEL | 


similar to multidrug resistance protein I 


Ribosomal protein L10 I 


Similar to unknown proteins | 


excinuclease ABC (subunit C) | 


Transmembrane N-terminal domain, C-termirtal domain similar 
to hydrolases 


similar to NADH dehydrogenase | 


similar to dipeptidase j 


similar to unl<nown proteins j 


similar to unknown proteins | 


1429976-1430341 m ribosomal protein L7/L1 2 | 


Hpr (ser) kinase/phosphatase I 


Similar to unknown proteins | 


Similar to unknown proteins | 


Similar to unknown proteins | 


Similar to oxidoreductase I 


Similar to unknown proteins I 


Similar to unknown proteins I 


Similar to unknown proteins I 


Similar to signal recognitton particle and to cell division protein 
FtsY 


similar to glycine betaine/carnitine/choline ABC transporter (ATP- 
binding protein) 


Isimilar to choline ABC transporter (permease) 1 


similar to glycine betaine/carnitine/choline ABC transporter 
(osmoprotectant-binding protein) 


similar to glycine betaine/carnitine/choline ABC transporter 
(permease) 


Isimilar to efflux protein (truncated) I 


Isimilar to transcriptional regulator (Rgg like) 1 


1 Unknown 


{Unknown 


1 Unknown 1 


1 pseudogene 1 


2108908-2109204 p |l 


2109304-2110926 m |i 


1348211-1349551 m |! 


E 
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Oi 
O 
CO 

1 

in 
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s 

CO 

xr 


1347385-1348152 p | 


1345445-1347226 m | 


1343622-1345403 p 


1342850-1343452 m | 


1341397-1342803 m j 


1340716-1341300 m 1 


1339967-1340701 m ' 


782771-783706 p i 


782280-782543 p j 


781741-782199 p | 


779616-781778 p | 


778468-779511 p I 


778207-778335 m ! 


777299-778201 m I 


776487-777299 m 


774840-776450 p 


256648-257793 m 


1 256013-256648 m 


255084-256010 m 


254433-255083 m 


1 253190-254176 p 


1 252257-2531 17 p 


' 251133-251414 p 


; 1429562-1429735 m 


1 250713-251099 p 


250324-25Q728 p 
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SA-1926.2 1 
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SA-1 931.1 1 


SA-1 932.2 


SA-1 933.2 i 


SA-1 934.2 1 


SA-1 935.1 J 


1007 : SA-1937.1 1 


1009 SA-194.1 j 


SA-1 940.3 1 


SA-1 942.1 1 


SA-1 943.1 1 


SA-1 944.1 j 


SA-1 945.1 1 


SA-1 946.1 1 


SA-1 949.1 1 


SA-1951.1 


SA-1 952.2 


SA-1 953.2 


1 SA-1 954.1 


SA-1 955.1 


SA-1956.1 


1 SA-1 957.1 


1 SA-1958.1 


1 SA-1 959.1 


1 SA-1 96.1 


1 SA-1 960.1 


1 SA-1961.1 
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1017 1 


1020 1 


1021 


1022 
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. 1029 
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3147 1 
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o 
t»- 

cn 


1 3171 


1 3172 


3173 
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ISEQ ID n' 5286 1 
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SEQ ID n' 5289 


ISEQ ID n° 5290 | 


ISEQ ID n* 5291 1 


jSEQ ID n' 5292 j 


ISEQ ID n« 5293 ; 


ISEQ ID n* 5294 1 


ISEQ ID n" 5295 | 


ISEQ ID n' 5296 | 


ISEQ ID n' 5297 | 


ISEQ ID n* 5298 j 


ISEQ ID n' 5299 | 


ISEQ ID n* 5300 1 


ISEQ ID n° 5301 | 


ISEQ ID n' 5302 1 


SEQ ID n* 5303 


SEQ ID n" 5304 


SEQ ID n" 5305 


SEQ ID n» 5306 


SEQ ID n* 5307 
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SEQ ID n' 6312 
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Unknown 1 


Unknown 


similar to ATP-dependent helicase 


similar to unknown proteins 


similar to unknown proteins 


1 390283-1 392160 m similar to coniugatlve transooson relaxase 1 


Similar to plasmid protein (replication protein 7^ 


similar to lactose repressor 


similar to unknown proteins 


Similar to unknown proteins 


similar to transcriptional regulator 


Unknown 


Similar to UDP-D-glucose:galactosvl alucosvltransferase 


862527-863243 p similar to unknown proteins 1 


Similar to methyl transferase (from transooson) 


Alanyl-tRNA synthetase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to DNA mismatch repair protein MutS 


Similar to unknown proteins 


Simitar to thioredoxin 


Similar to transcriptional regulators 


3.2 DNA restriction/modification and repair 


Similar to A/G-specific adenine glycosylase 


Similar to unknown protein 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to other proteins 


Similar to transcriptional regulator 


Similar to Cyclopropane fatty acid synthase 


Similar to unknown proteins 


Unknown 


1041931-1043013 m .similar to unknown proteins 1 


similar to unknown proteins 


Similar to unknown proteins 


excinuciease ABC (subunit A) | 


249517-250104 p I 


249110-249517 p | 


1393216-1395234 m 1 


1392522-1392881 m 1 


1392147.1392512 m ! 


1428750Tl429565m 1 


1389373-1390128 m 1 


866024-866614 m 1 


865181-865939 p 1 


864963-865178 p I 


864595-864918 p 1 


863331-864149 p 1 


1428091-1428513 m I 


859827-862445 p 1 


859326-859811 p | 


1831275-1831817 m I 


1828851-1831190 m | 


1828347-1828847 m 1 


1827952-1828266 m 1 


1827313-1827906 p | 


1427312-1428664 m i 


1826012-1827136 p 1 


1866085-1866867 m 1 
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1864198-1864734 m 1 


1863567-1864154 m I 


186271 5-1 863440.m | 
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SA-1 976.2 1 


SA-1 977.1 1 


SA.1978.1 1 
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SA-1 983.2 1 


SA-1985,2 1 


SA-1986,1 1 
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SA-1 99.1 i 
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SA-1994.1 
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CO 


SA-20.1 


SA-200.1 


SA-2000.1 


SA-2004.2 


CM 
CO 

o 


CO 
CO 

o 


a 

o 


in 

CO 

o 


CD 
CO 

o 


CO 

o 


00 

CO 

o 


o> 

CO 

o 


o 

s 


o 


CM 
O 


CO 

o 


i 


in 

s 


1 


5 


00 

o 


o> 

s 


o 
m 
o 


In 
o 


CM 

in 
o 


CO 

m 
o 


o 


in 
in 
o 


o 


in 
o 


OO 

in 
o 


o> 
m 
o 


o 

CD 
O 


S 

o 


CM 
CD 
O 


i 


IO 

8 


CD 


g 


CO 

s 


3178 


3179 


3180 


SEQ ID n'' 5317 3181 
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ISEQ ID n" 5338 I 


ISEQ ID n* 5339 I 


ISEQ ID n^ 5340 | 
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Similar to unknown proteins 1 


Similar to transport protein I 


30S ribosomal protein S1 8 I 


Similar to single strand binding protein | 


30S ribosomal protein S6 I 


cell division protein FtsH | 


similar to hypoxanthine guanine phosphoribosyltransferase | 


similar to other protein | 


weakly similar to beta-lactamase I 


similar to unknown proteins 1 


Similar to transcriptional regulator (Lad family) | 


similar to maltose ABC transporter (binding protein) | 


Similar to maltose/maltodextrin ABC transport system 
(permease) 


similar to maltodextrin ABC transporter (permease) j 


similar to di-tripeptide ABC transporter (pemiease) | 


Similar to putative mutator MutT protein 1 


Unknown j 


Unknown j 


simitar to plasmid replication protein | 


similar to unknown proteins I 


2148362-2149462 p similar to other proteins 1 


[Unknown I 


Unknown 1 


Isimilar to unknown proteins I 


Isimilar to cadmium-efflux system accessory protein | 


[putative transport protein 


1 hypothetical transport protein 


Isimilar to threonine synthase | 


jsimilar to alcohol dehydrogenase 1 


lUnknown 1 


1 similar to alcohol-acetaldehyde dehydrogenase 1 


Isimilar to unknown proteins 


[Similar to S-adenosylmethionine tRNA ribosyltransferase j 


1 Similar to transcriptional regulator. MarR family j 


(Similar to unknown proteins 1 


SA-2005.1 : 1822035-1822706 m |l 


1822731-1823675 m |l 


1823845-1824084 m |: 


1824129-1824620 m |i 


1824632.1824919 m |; 
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12165-13439 p | 


10877-12163 p 1 


1426503-1426889 m | 


1569925-1570953 m | 


1571209-1572456 p j 


1572554-1573924 p 


1573924-1574760 p | 


1574991-1576463 p | 


1576508.1576972 m | 
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2150270-2150875 p | 
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2148042-2148362 p 


2147391-2147840 p 


1 2145655-2147070 p 


1 2145266-2145604 p 


1 2144640-2145254 p 


1 75018-76298 p 


1 73423-74913 p 


1 72286-73302 p 


1 1425689-1426270 m 


1 69465-72107 p 
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1 847892-848920 m 


1 847368-847805 m 


1 846249-847313 p 
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1078 ! SA-2015.2 | 
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SA-2019.3 1 


SA-202.1 ! 


SA-2022.2 1 


SA-2024.1 i 


SA.2025.1 


SA-2026.1 1 


SA-2028.1 J 


SA.2029.1 1 


SA.203.1 1 


SA.2030.2 1 


SA-2033,2 1 


SA-2034.1 1 


1094 SA-2035.4 | 
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Similar to permease (gluconate ?) I 


Similar to putative glycerate kinase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to beta-glucosidase 


ribosomal protein S17 


ribosomal protein L29 


ribosomal protein LI 6 


ribosomal protein S3 


ribosomal protein L22 


ribosomal protein S19 


similar to plasmid transfer complex protein TrsK 


ribosomal protein L2 


ribosomal protein L23 


ribosomal protein L4 


ribosomal protein L3 


ribosomal protein S10 


Similar to transposase (truncated) 


similar to transposase, N-terminal part 
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streptococcal C5a peptidase 


Similar to sucrose-6-phosphate hydrolase 


Similar to transcriptional regulator (Lad family) 


Similar to transcription termination protein NusB 


Similar to unknown proteins 


Similar to translation elongation factor EF-P 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (binding protein) 


glucose.6-phosphate Isomerase 


similar to unknown protein 1 


similar to unknown protein 


similar to putative ABC transporter (binding protein) 


Unknown . 


similar to unknown protein from conjugative transposon I 


similar to UDP-glucose pyrophosphorylase I 
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jimilar to glyceroI-3-phosphate dehydrogenase 


iimilar to ribonuclease P protein component 1 


similar to unknown protein and to B. subtilis SpolllJ protein 1 


Unknown — i 


Unknown I 


similar to hypothetical transcriptional regulator I 


Unknown I 


Unknown 1 


similar to unknown protein from conjugative transposons 1 


Unknown 1 


Similar to unknown proteins 1 


Unknown 1 


Unknown 1 


Unknown | 


Unknown 1 


Unknown 


1 Similar to manganese-dependent inorganic pyrophosphatase 


1 similar to plamsid transfer complex protein TraE 1 


1 Similar to pyruvate-formate lyase activating enzyme 


iSimilar to unknown protein 


ISimilar to unknown proteins 


[Similar to unknown protein 1 


ISimilar to unknown protein 


1 similar to unknown protein 1 


1 similar to transposase 


jdegenerate transposase 


1 1 353776-1 354036 p 'degenerate tmasposase 1 


j Degenerate transposase 


[Similar to histidine triad protein 


[laminin-binding surface protein 


similar to two-component response regulator VncR 


Isimilar to two-component sensor hlstidme kinase vncs 


ISimilar to transposase C-terminal end (truncated) | 


Similar to unknown proteins 


similar to FtsW and RodA proteins 1 
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similar to unknown protein 1 


DNA gyrase, subunit B ( 


Similar to two-component response regulator 


ribosomal protein L34 


Similar to unknown proteins 


Similar to betalne ABC transporter permease and substrate 
binding protein 


similar to glycine betaine ABC transporter (ATP-blndinq protein) 


similar to transcription antitermlnation factor nusG 


similar to glycosyl transferase 


similar to glycosyl transferase 


similar to unknown protein 


similar to unknown proteins 


similar to transporter 


similar to staphyloklnase and streptokinase 


similar to unknown protein 


similar to unknown protein 


similar to succinic semialdehyde dehydrogenase 


similar to glycine betaine transporter (N-terminal end) 


similar to glycine betaine transporter (C-terminal end) 


similar to unknown protein C-terminal part 


similar to unknown protein (N-terminal part) 


similar to unknown proteins I 


similar to carbon starvation protein A I 


similar to two-component response regulator lytR 1 


similar to two-component sensor histldine kinase LytS 1 


Unknown 1 


Unknown 1 


Unknown » 1 


Similar to ATP-dependent RNA helicase, DEAD-box family 1 


putative ABC transporter (binding protein) 1 


similar to ABC transporter (permease) 1 


similar to ABC transporter (ATP-binding protein) 1 


[Similar to unknown proteins 1 
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Similar to surface proteins, putative peptidoglycan linked protein 
[LPXTG motif) 


similar to cardlolipin synthetase 1 


similar to formate-tetrahydrofolate ligase " '| 


simiiar to lipoate-protein ligase I 


similar to unknown protein | 


similar to ATP-dependent CIp protease ATP-blnding subunit 
CIpA 


Putative peptidoglycan linked protein (LPXTG motif) I 


similar to trigger factor (prolyl isomerase) I 


similar to unknown protein j 


Similar to unknown protein 1 


similar to unknown protein | 


similar to phosphomethylpyrimidine kinase I 


similar to tRNA pseudouridine synthase A 1 


Similar to other proteins 1 


similar to unknown proteins 


similar to transcriptional regulator 


similar to DNA repair and recombination protein RecN I 


similar to unknown proteins | 


similar to unknown proteins j 


Similar to unknown proteins 
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jsimilar to transcriptional regulator, GntR family 
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Similar to neuraminidase 1 


Similar to butative rhamnosyltransferase 


Similar to nucleotide-sugar dehydratase 


Similar to 4-diphosphocytidyl-2C-methyl-D-erythrito! synthase 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine fnetabolism 


possible surface protein 


Similar to unknown protein 


Unknown 


Similar to putative glycosyl transferase 


similar to rhamnosyltransferase 


similar to unknown protein 


similar to unknown protein 


similar to unknown protein 


similar to amino acid ABC transporter (ATP-blndinq protein) 


similar to amino acid (glutamine) ABC transporter (binding 
protein) 


Unknown 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (ATP-binding protein) 


similar to phosphate ABC transporter (ATP-binding protein) 


similar to phosphate uptake regulatory protein 


similar to hypothetical ABC transporter (permease) 


similar to ABC transporter (ATP-binding protein) 


simiiar to DNA topoisomerase 1 


similar to 4.diphosphocytldyl-2-C-methyl-D-erythritol kinase 


similar to transcriptional regulator 


Similar to ABC transporter (ATP-binding protein) 1 


Similar to (metal) ABC transporter (pemiease) 


similar to DNAse (competence related) 


similar to amino acid permease 


Similar to small protein SmpB 


similar to exoribonuclease R I 


Similar to ABC transporter (ATP-binding protein) | 
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2112289-2113185 m ISimilar to ABC transporter (permease) | 


2113201-2114163 m putative ABC transporter (binding protein) | 


similar to unknown proteins 1 


similar to unknown proteins 1 


Similar to unknown proteins | 
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dTDP-L-rhamnose synthase 1 


Similar to unknown protein I 


RNA polymerase major sigma factor RpoD I 


DNA primase " " I 


similar to DNA-directed RNA polymerase (delta subunit) | 


Unknown I 


similar to CTP syntiietase - I 


similar to unknown protein 1 


similar to unknown proteins | 


Unknown I 


similar to unknown protein I 


similar to unknown protein | 


similar to tRNA pseudouridine 55 synthase 1 


macrolide-efflux protein I 


Unknown I 


Similar to other proteins I 


iSimilar to transcription elongation factor GreA I 


ISimilar to putative amidase 1 


Isimilar to ammonium transporter | 


ISimilar to unknown protein I 


ISimilar to unknown protein I 


ISimilar to unknown protein 1 


ISimilar to glycerol (sugar)-3-phosphate transporter | 


{similar to phage repressor-iike protein 1 


jsimilar to hydroxyethyl thiazole kinase (ThiM) 


ISimilar to phosphomethylpyiimidlne kinase (ThiD) 1 


[Similar to putative thiamin biosynthesis protein 


jSimilar to unknown proteins 


{Similar to capsular polysaccharide synthesis protein 


ISimilar to unknown proteins 1 


{Similar to putative rhamnosyltransferase 1 


Isimilar to unknown proteins 


similar to 5 -nucleotidase, putative peptidoglycan bound protein 
(LPXTN motif) 


..similar to polypeptide deformyiase 


ISimilar to NADP-specific giutamate dehydrogenase 1 
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Similar to ATP-dependent DNA helicase | 


similar to unknown proteins 


similar to uracil permease 1 


Unknown 


Unknown 1 


similar to probable amino-acid transporter 1 


similar to putative cation efflux system protein 1 


similar to unknown proteins 1 


similar to unknown proteins 


similar to unknown proteins 1 


Unknown 


Unknown 1 
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similar to repressor protein - phage associated 


Similar to putative pseudouridine synthase 


Unknown 1 


jSimilar to unknown protein 


[Similar to unknown protein 1 


iSimilar to unknown protein 


ISimilar to Phosphoribosylpyrophosphate synthetase I 


{similar to aspartokinase 


Isimilar to unknown protein 1 


Isimilar to enoyl-CoA isomerase 


j Unknown 


ISimilar to unknown proteins 


similar to alpha protein, putative peptdoglycan linked protein 
(LPXTG motif) 


Isimilar to transcriptional regulator (AraC/XylS family) 


Isimilar to transcriptional regulator tetR-famlly 1 


Isimilar to cation efflux system protein 


Isimilar to similar to oxydoreductases. N-terminai part 


Isimilar to oxydoreductase (C-terminal part) 
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Isimilar to alcohol dehydrogenase (N-terminai part) 
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Similar to other proteins 1 


Similar to decarboxylase 


Similar to unknown proteins 


Similar to hypothetical transcriptional regulators 


similar to unknown proteins 


Similar to surface proteins, putative peptidoglycan bound protein 
(LPXTS motiO 


similar to ABC transporter (permease) 


Similar to ribonucleoside-diphosphate reductase 2 alpha subunit 


Similar to unkhwon proteins 


similar to ribonucleoside-diphosphate reductase beta chain 


similar to rhamnosyltransferase 


Putative peptidoglycan bound protein (LPXTS motif) similar to 
C5A peptidase 


similar to unknown proteins 


Similar to purine nucleoside phosphorylase 


similar to ABC transporter (ATP-binding protein) 


Similar to other proteins including hypothetical 
methyltransferases 


Similar to unknown proteins 


Similar to unknown proteins | 
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Similar to preprotein translocase secA | 


Similar to unknown proteins | 


Similar to unknown protein j 


'Similar to unknown protein I 


1 Similar to preprotein translocase secY | 
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Similar to streptococcal hemagglutinin from Streptococcus 
jordonil. Putative peptidoglycan bound protein (LPXTG motif) 


Similar to transcription regulator RofA related 1 


3xcinuc!ease ABC chain B 1 


Similar to unknown proteins 1 


glutamine ABC transporter permease and substrate binding 
protein 


glutamine ABC transporter ATP-bindlng protein I 


Unknown 1 


Similar to unknown proteins | 


Similar to GTP-binding protein 1 


Similar to aminopeptidase 


Putative peptidoglycan bound serine rich protein (LPXTG motif) 


similar to amidase or hydrolase, putative peptidoglycan bound 
protein (LPXTG motif) 


Similar to fructoklnase 1 


iSimilar to mannose.6-phosphate isomerase 1 


Similar to preprotein translocase SecA subunit 


[similar to 2-dehydro-3-deoxyphosptioheptonate aldolase 1 


[similar to holo-acyl-carrier protein synthase 


isimilar to alanine racemase 


i 1789964-1791502 m Similar to immunogenic secreted protein | 


1 Similar to ATP-dependent DNA helicase RecG 


ISimilar to oxidoreductase 1 


1 Unknown 


1 hypothetical gene 1 


ISimilar to shikimate 5-dehydrogenase 


■Similar to L-asparaginase 


1 Similar to unknown proteins 


(Similar to unknown proteins 


ISimilar to putative aminotransferase 


ISimilar to transcriptional regulator (CodY family) 


ISimilar to other proteins 


ISimilar to 3-hydroxyacyl-CoA dehydrogenase 


1 Similar to unknown proteins 1 
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lar to unknown proteins 1 


lar to Pyruvate Phosphate Dikinase 


lar to Glu-tRNA Gin amidotransferase subunit C 


lar to Glutamyl-tRNA Gin amidotransferase subunit A 


lar to Glu-tRNA amidotransferase subunit B 
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similar to unknown proteins I 


similar to 6-enolpyruvylshikimate-3-phosphate synthase 1 


similar to shikimate kinase 1 


Similar to membrane bound transcriptional regulator I 
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terminal part 


similar to putative transcriptional regulator (TetR/AcrR family) N- 
terminal part 


similar to C protein alpha-antigen from Streptococcus 
agalactiae] N-tenminal part 


similar to transposase, truncated. 


similar to unknown proteins I 


similar to transcriptional regulator (TetR/AcrR family) 1 


similar to transposase N-terminal part 


similar to unknown protein 


similar to chaperonin (heat shock protein 33 homolog) 1 


similar to transcriptional regulator (C-terminal part) 


similar to transcriptional regulator (N-terminal part) 


Putative peptidoglycan bound protein (LPXTG motif) 1 


Putative peptidoglycan bound protein (LPXTG motif) | 


similar to sortase protein 


1 similar to sortase protein | 


jsimilar to unknown proteins 


|50S Ribosomal protein L33 


i50S ribosomal protein L32 


Ihistidyl-tRNA synthetase 1 


|aspartyl-tRNA synthetase 


similar to unknown proteins 


similar to unknown proteins 


Isimilar to unknown proteins | 


larginyl-tRNA synthetase 1 


ISEQ ID n'* 6427 * 4291 1 2160 ' SA-787.1 | 638356-639420 m \i 


Q. 

CM 

CO 

o> 
o 

s 

1 

CO 
CO 

CO 


640925-641437 p \\ 


641494-642867 p |! 


642968-644323 p ti 


644431-644652 p |l 


644770-645507 p I 


o. 

CD 
CO 

«? 

CO. 

m 
•«r 

CD 


646475-646711 m | 


646692-647000 m 


647183-647515 p 1 


647636-648562 m | 


1028864-1031071 m | 


2175288-2175827 p | 


648505-648780 m | 


Q. 
O 

m 
o 
a> 

CO 

i 

3 


649438-649785 m j 


649979-650398 m | 


660399-651187 m 1 


651570-653234 p 


1 653323-654246 p 


! 654248-655165 p 


1 655122-655973 p 


1 2175913-2176209 m 


1 2144199-2144348 p 


1 2144001-2144183 p 


1 2142501-2143781 m 


1 2140657-2142408 m 


2139723-2140667 m 


E E 

3 CO 

- o> 

- CO 

? ^ 

0 CO 

5 GO 
CO 

M CM 


1 2138408-2138716 p 


1 2136629-2138320 p 


SA-788.1 ! 


SA-789.1 1 


SA-790.1 1 


SA-792.1 1 


SA-793.1 ! 


SA-794,1 1 


SA-795.1 1 


SA-796.1 


SA-797.1 


SA-798.1 


SA-799.1 1 


SA-8.1 1 


SA-80.1 1 


SA-800.1 1 


SA-801.1 1 


SA-803.1 1 


SA-804.1 1 


SA-805.1 


SA-806.1 


SA-807.1 


i SA-808.1 


1 SA-809.3 


1 SA-81.1 


1 SA-811.2 


1 SA-812.1 


1 SA-814.1 


1 SA-817.2 


SA-819.2 


3 <=> 

0 ft! 

1 00 


1 SA-821.1 


SA-822.1 


SEQ ID n" 6428 1 4292 i 2151 1 


2152 1 


2154 . 


2155 1 


2156 1 


2157 1 


2158 1 


2159 


2160 


2161 


2162 1 


2163 1 


2164 1 


2165 1 


2166 1 


2167 1 


2168 1 


2169 1 


2170 


2171 


' 2172 


; 2173 


1 2174 


2176 


2177 


2178 


2179 


2180 


2182 


2183 


2184 


SEQ ID n^ 6429 4293 


4294 


4295 


4296 1 


4297 1 


4298 1 


4299 


4300 


4301 


4302 1 


4303 1 


4304 1 


4305 1 


4306 1 


4307 


4308 


4309 


4310 


4311 


4312 


SEQ ID n" 6449 1 4313 


SEQ ID n' 6450 • 4314 


1 4315 


4316 


4317 


4318 


4319 


4321 


4322 


4323 


SEQ ID n* 6430 I 


CO 

CO 
o 

c 

2 
a 

UJ 
CO 


CM 
CO 

CO 

0 

c 

9 
o 

UJ 
CO 


ISEQ ID n* 6433 1 


ISEQ ID n" 6434 i 


m 

CO 

<D 
o 
C 

9 
a 

UJ 
CO 


SEQ ID n** 6436 i 


SEQ ID n** 6437 


ISEQ ID n^ 6438 1 


ISEQ ID n« 6439 1 


o 

CO 

0 

c 

9 
o 

UJ 
CO 


ISEQ ID n" 6441 | 


SEQ ID n* 6442 


n 

5 

CO 
o 
C 

9 
o 

UJ 
CO 


SEQ ID n' 6444 


SEQ ID n** 6445 


CO 
TT 

CO 
o 
C 

9 
o 

UJ 
CO 


(O 

0 

C 

g 
o 

UJ 
(0 


SEQ ID n* 6448 


SEQ ID n*6451 


SEQ ID n° 6452 


SEQ ID n* 6453 


SEQ ID n* 6454 


SEQ ID n* 6455 


o in 

S (O 
> o 
C C 

9 9 

3 O 

U UJ 

:o CO 


SEQ ID n'* 6458 


ISEQ ID n^ 6459 



wo 02/092818 



407 



PCT/IB02/03059 



similar to arginine repressor ArqR 1 


DNA mismatch repair protein MutS 


similar to cold shock orotein E 


similar to DNA mismatch repair MutL 


putative membrane-spannina protein (efflux transoorter ?^ 


similar to Holiday junction DNA helicase 


similar to unknown proteins 


similar to 3-methyl-adenine DNA alvcosvlase I 


Similar to competence-damage inducible protein CinA 


recombination protein RecA 


similar to unknwon proteins 


similar to unknwon proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


replicative DNA helicase DnaC 


Similar to trehalose-specific PTS enzyme IIABC 


similar to trehalose-6-phosphate hydrolase 


Similar to hypothetical transcriptional antitemiinator (BalG famllv) 


similar to unknown proteins 


putative transmembrane protein similar to unknown proteins 


similar to other proteins (including putative transketolase) 


Similar to other proteins (including putative transketolase) 


50S ribosomal protein L9 


similar to unknown proteins 


iTibosomal protein SI 5 


polynucleotide phosphorylase. alpha chain 


similar to unknown protein 


similar to serine acetyltransferase 1 


Unknown 


cysteinyl-tRNA synthetase 1 


similar to unknown proteins 


similar to tRNA/rRNA methyltransferase 


similar to unknown protein 


similar to unknown proteins I 


E 

CD 

i 

CO 

o 

a> 
m 

CO 
CM 


E 

CO 

5> 

in 

CO 

CO 
CO 
CO 
CO 

T— 

OJ 


2133077-2133280 p 1 


2130878-2132851 m 1 


2129614-2130846 m 1 


E 

CM 
CD 

o> 

CM 
f— 

5^ 

CM 
O 

o 

C7) 
CM 


E 
ob 

CD 

CO 
CM 


2128448-2128999'm 1 


2127100-2128359!m 1 


E 

CD 

8 

CM 

CO 
00 

in 

CM 


E 

?1 

CD; 
in 
CM 

f? 

CM 

in 

CM 
CM 


E 

o 
in 

CM 

2 

o 

GO 

xr 

CM 
CM 


E 
in 
o 
oo 

s 

00 
CO 

CM 
CM 


E 

o 

cd: 

CO 

cm 

1 

CM 
CM 


E 

CO 
Oi 
N.^ 
CO 
CM 

CM 

- • ■ 
CM 

in 

CM 
CM 
CM 

CM 


2177693-2179048 m | 


216500-218530 p 1 


CO 

o 

CM 
OJ 

OJ 

in 
oo 

CM 


Q. 
CO 
. CO 
i CD 
~ CM 
. CM 
CM 

IO 

o 

CM 
CM 


222636-222920 p ' 


222933-224288.P i 


224291-225148 p | 


Q. 

o 

CD 
CM 

s 

in 

CM 
CM 


2179091-2179543 m I 


226102-227442 p ! 


227530-227799 p i 


228180-230309 p I 


o. 

CO 
CD 

o 

CO 
r- 

co 

CM 


231072-231656 p I 


231666-231848 p I 


pL 
CO 
CO 

T^- 

CO 
CO 

in 

s 

n 

CM 


23318.1-233567 p I 


L 233676^234425 p 1 


a. 
o 

CM 

- 1 • 
CM^ 
CM 

i 

CM 


2179549-2181531 m 


SA-823.1 1 


SA-825.1 1 


SA-826,1 1 


SA-827,1 1 


SA-828.1 1 


SA-829.1 1 


SA-83.1 1 


T— 

CO 
CO 


oi 

CO 

% 

CO 


SA-833.1 1 


SA-834.1 ! 1 


SA-835.1 1 


SA-837.1 . 1 


SA-838.1 , 1 


SA-839,2 1 


SA-84.1 1 


SA-842.3 1 


SA-843.1 ! 


SA-844.1 


SA-845.1 1 


SA-846.1 1 


SA-848.1 


SA-849.1 


SA-85.1 


SA-850.1 


SA-851.1 1 


SA-852.1 


SA-853.1 


SA-854,1 


SA-855.1 1 


SA-856.1 1 


SA-857.1 


SA-858.1 


SA-859.1 


SA-86.1 


2185 1 


2186 1 


2187 1 


2188 1 


2189 ! 


2190 


2191 1 


2192 1 


2193 


2194 1 


2195 


2196 1 


2197 


2198 1 


2199 1 


2200 1 


2201 \ 


2202 1 


2203 


2204 ! 


2205 I 


2207 1 


2208 1 


2209 1 


2210 1 


2211 1 


2212 


2213 1 


2214 


2215 


2216 


2217 


2218 


2219 j 


2220 1 


4324 


4325 


4326 i 


4327 


4328 


4329 


4330 


4331 


4332 


4333 


4334 


4335 


4336 


4337 


4338 


4339 1 


4340 


4341 1 


4342 


4343 1 


4344 1 


4345 


4346 ! 


4347 1 


4348 


4349 1 


4350 i 


4351 j 


4352 


4353 i 


4354 


4355 


4356 


4357 


4358 


o 

CD 
o 
C 

O 


<D 

o 
C 

a 


CM 
CD 

o 
C 

a 


CO 
CD 

s 

0 

c 
O 


s 

c 
Q 


in 

CD 

s 

D 

c 
O 


CD 
CD 

xr 

CD 

0 

C 

D 


CD 
(D 

0 

C 

O 


CO 
CD 

CD 
o 
C 

O 


CO 

s 

0 

C 
□ 


o 

0 

c 
O 


s 

» 

c 

□ 


CM 

s 

0 

C 

O 


CO 

s 

a 

C 

D 


0 

c 
O 


in 

s 

o 
C 

O 


CD 

CD 
o 
C 

a 


o 
C 

O 


ID n" 6478 1 


ID n» 6479 1 


o 

CO 

s 

0 

c 
Q 


OO 

Z 

o 
C 

O 


CM 
CO 

z 

o 

c 
O 


CO 
00 

s 

o 
C 

o 


S 

CD 
o 
C 

O 


in 
oo 

z 

o 
C 

O 


ID n'* 6486 


00 

CD 
o 
C 

O 


00 
GO 

s 

o 

c 

a 


ID n' 6489 


ID n" 6490 


ID n" 6491 


fM 

z 

o 
C 

O 


CO 

cn 

z 

o 
C 

a 


Z 

o 
C 

O 


SEQI 


a 

UJ 
CO 


o 
m 

CO 


O 

LU 1 
CO ( 


CI 
LU 
CO 


O 

\u 

[0 


O 
Lil 

CO ( 


a 

LU 
CO 


o 

UJ 1 
CO ( 


a 

LU 
CO 


O 
LU 
CO 


O 
LU 
CO 


o 

LU 
CO 


O 
LU 


O 
UJ 
CO 


o 

UJ 
CO 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


|SEQ 



wo 02/092818 



408 



PCT/IB02/03059 



similar to unknown protein 1 


Similar to transposase 1 
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Isimilar to cell wall muropeptide branching enzyme 1 


Isimilar to unknown proteins 


Isimilar to unknown proteins 
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aimilar to RNA helicase | 


similar to uridine kinase 1 


similar to unknown proteins 1 


Similar to DNA polymerase III gamma/tau subunit 1 


similar to unknown proteins | 


similar to transcriptional repressor of the biotin operon 1 


S-adenosylmethionine synthetase 1 


simitar to fibronectin-binding protein 1 


Unknown 1 


hypothetical protein 1 


similar to unknown proteins 1 


similar to unknown proteins 1 


Similar to cation ABC transporter (ATP-blnding protein) | 


Unknown 1 
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similar to unknown proteins 1 
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similar to aggregation promoting protein (adhesin involved m 
high frequency of conjugation) 
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similar to two-component sensor histidine kinase 
Similar to D-a!anine-D-alanyl carrier protein ligase 


875835-876917 m |i 


877062-877691 p |! 


877778-878275 p Is 


878275-879939 p ji 


880028-880222 p |i 


880203-881138 m |i 


881323-882519 p | 


883038-884945 P 1 


8850.12-885557 p | 


a 
in 

s 

m 

<D 

fe 

00 
00 


885953^86519 p | 


886516-887070 p | 


887074-888360 p | 


1170326-1171621 m | 


1171761-1172060 m | 


1172071-1173318 m | 


1173315-1174946 m | 


1174918-1175292 m ! 


1175295-1175858 m i 


2188179-2188718 m 


1175861-1176157 m 


I 1176201-1176500 m 


1 1176552-1179788 m 


1 1179790-1180155 m 


1180197-1182242 m 


1 1182242-1182733 m 


1 1182755-1183537 m 


1 1183537-1183809 m 


1183829-1184434 m 


li 


1 1187902-1 190292 m 


1899710-1900897 m 
1898029-1899564 m 


SA-941.1 r 


SA-942.1 1 


SA-943.1 1 


SA-944.1 


SA-945.1 ! 


SA-946.1 1 


SA-947.1 1 


SA-948.1 J 


SA-949.1 1 


SA-950.1 1 


SA.951.1 1 


SA-952.1 1 


SA-953.2 1 


SA-954.1 1 


SA-955.1 ! 


SA-956.1 1 


SA-957.1 1 


SA-958.1 1 


SA-959.1 1 


SA-96.1 


SA-960.1 


SA-961.1 


1 SA-964.1 


1 SA-966.1 


SA-967.1 


1 SA-968.1 


1 SA.969.1 


1 SA-970.1 


SA-971.1 


ji a> 
i:< 

0 CO 


1 SA-975.2 


SA-976.2 
SA-977.1 


2289 1 


2290 


2291 


2292 


4430 1 2293 


2294 1 


2295 1 


2296 1 


2297 1 


2298 1 


2299 1 


2300 


2301 


2302 1 


2303 


2304 1 


2305 


2306 1 


2307 1 


2308 


2309 


2310 


2311 


2312 


2313 


2314 


2315 


2316 


2317 


2319 


2320 


2321 
2322 


4426 1 


4427 


4428 


4429 


4431 1 


4432 1 


4433 


4434 


4435 


4436 


4437 


4438 


4439 


4440 1 


4441 1 


4442 


4443 


4444 


1 

4445 ■ 


. 4446 


1 4447 


4448 


4449 


4450 


4451 


4452 


4453 


4454 


4456 


4457 


4468 
4459 


ISEQ ID n' 6562 1 


SEQ ID n" 6563 1 


SEQ ID n" 6564 1 


SEQ ID n" 6565 


to 

(O 

m 
<o 

o 
C 

9 
o 

Ul 
(0 


SEQ ID n" 6567 


ISEQ ID n» 6568 1 


SEQ ID n° 6569 


SEQ ID n' 6570 


SEQ ID n** 6571 


SEQ ID n** 6572 


SEQ ID n*' 6573 1 


SEQ ID n** 6574 


SEQ ID n" 6575 


SEQ ID n*» 6576 


m 
<o 

o 
C 

9 
o 

UJ 
(0 


SEQ ID n*^ 6578 1 


SEQ ID n* 6579 1 


SEQ ID n** 6580 


SEQ ID n" 6581 


SEQ IDn"* 6582 


CO 

oo 

lO 

<o 

o 
C 

9 
o 

UJ 
CO 


SEQ ID n^ 6584 


in 

00 

in 

(0 
o 
C 

9 
o 

IL 
CO 


CO 
oo 
m 

CO 
e 
C 

9 
o 

UJ 
CO 


00 

in 

CO 
e 
C 

9 
a 

u 

CO 


00 
00 

in 

CO 
o 
C 

9 
o 

UJ 
CO 


Oi 

00 

in 

CO 
o 
C 

9 

o 
a 

CO 


SEQ ID n» 6590 


r- CM 

Ji Oi 

n in 

D CO 

> p 
c c 

3 9 
0 o 

LU UJ 
to CO 


CO 

ai 
K2 

CO 
o 
C 

9 
o 

UJ 
C/] 


SEQ ID n'6594 
SEQ ID n' 6595 



wo 02/092818 



411 



PCT/IB02/03059 



I 

Q. 
C 
O 

m 
c 

TO 

9 
o 

< 



(0 
0) 



O 

CD 
< 

> 

''4-* 

B 

CL 



Q 
c 

£2 
8 

Q. 

& 
C 

5 

o 
c 
c 

CO 

I 

O 
< 



CM 

CO 

o 

00 

o> 

; . I . 

<o 

CD 
C3> 
00 



cn 

00 
GO 

CM 



o 

CM 

m 

CO 

o> 
oo 

.t— ' 
-^1 - 

00 

tn I 

CM I 

m 

C7) I 

oo < 



00 

% 

CO 



CO 
CM 
CO 
CM 



s 

5 



00 
O 

<i: 

CO 



< 

CO 



CM 
00 



CO 

Oi 

in 

CO 



O 
UJ 

CO 



in 
CO 

o 
C 

Q 
0) 



m 

CO 
o 
C 

9 
o 

UJ 
CO 



o 
o 

CD 
CD 



UJ ( 
(O I 















<u 


































<0 




































































Sfe 
















Pui 


















an 
















c 

n 


















ithyltr 


teins 


feras 




S 








open 


















w 

E 


8 


ns 




2 








urine 




asi 
















cx 
9 


Itra 




ulose-6-phosphate 3-epime 










uct 








m proteins 


wn proteins 


mily protein 


c& 
Z 

CD* 

z 

1 

0) 

c 
c 

0) 
T3 

< 

z 


nciing proteins ancj li^ 


iS ribosomal RNA methy 


wn proteins 


iwn proteins 


iwn proteins 


wn proteins 


ription repressor of p 


wn proteins 


ne-5-carboxylate red 








kno 


kno 






rt/bii 


kno 


u 
c 


u 
c 


kno 


nsc 


kno 


nroli 








c 


c 


rla< 


CD 


o 


C^ 


c 




c 


c 


c 




c 


>^ 














CL 


CM 




•c 




3 


3 


B 


3 


a 




c 


c 








S 


CO 


O 






s 




s 


o 


O 


S 


5 


now 


now 


2 


s 






c 




S 
















lar 


m 


din 


ilar 


Tra 


liar 


TO 


ilar 


ilar 


ilar 




ilar 


t— 

m 




V 






E 


6 


CO 


E 


CM 


E 


jUJ! 


E 


UJj 


£ 


1 


E 


1 


1 








'co 




x: 


CO 




CO 


tn 


'55 


CO 


CO 


CO 


"io 




'co 




.£ 






E 


E 


E 


E 


E 


c 
C 


E 


c 
c 


E 


c 


E 


Q. 


c 


^ — 


00 


CD 






s 




CO 


CM 


in 


CD 






CO 


in 






o 


O 






CM 


CD 


in 




CD 












00 


CO 




O 




CM 


IV 


in 


00 


CO 


o> 


CO 




in 


CO 


CO 


CD 




s 


CO 


CM 






O 


o 


a> 


oo 


1^ 


1*^ 


s 




C7) 


C3> 


o> 


o> 


o> 


C3) 


<Ji 


a> 


oo 


00 


CO 


CO 


oo 


oo 




CM 


00 


00 


00 


00 


00 


<P 


CO 






00 


CO 


OO 


<P 


GO 


CO 


o 

CM 
1 


o 






y— 
























T— 
1 


CM 


,M 

Oi 


CD 


1 

in 


. 1 


00 


1 

in 


1 

CD 






• 

CO 


t- 


1 

o> 


1- 
co 


CM 


CO 


CM 


OO 


o> 




CM 


CO 


o 


in 


in 


CM 


o 




o 




o 




CD 




o> 


CO 


O 


h- 




CM 


1^ 


00 


1^ 


o 


a> 


CO 


CD 






in 




CO 


CO 


CO 


CM 






o 


o> 


C7> 


a> 


h- 


rv 


CD 


CO 


O 




D) 


<3> 


Oi 


C3> 


C7> 


C7) 


00 


00 


00 


CO 


00 


00 


00 


CO 


00 


O 
CM 


o 


00 


CO 


00 


CO 


OO 


00 


CO 




00 


GO 


CO 


00 


00 


GO 


00 


CM 


T— 
















T— 




-r- 






y~ 


CM 


CM 


▼~ 


CO 




in 


CD 




od 


a> 


CT> 

% 


c> 




CO 


i 


in 


CD 




a6 


C7> 


00 


00 


00 


00 


00 


oo 


C7) 


5) 


o> 


Oi 


CD 


Oi 


Oi 


U) 


C7) 




(7) 


CJ> 


C3> 




C7> 


o> 


C7> 




Oi 


Oi 




Oi 


Oi 


Oi 


1 






^ 




^ 




CO 








< 


< 






^ 


<i 


CO 


Si 


















CO 


to 








CO 


00 


a> 


o 




CM 


CO 




m 


CD 




CO 


O) 


o 




CM 


CO 




CM 

CO 


CM 
CO 


CO 
CO 


CO 

CO 


CO 

CO 


CO 

CO 




CO 
CO 


CO 
CO 


CO 
CO 




CO 
CO 




CM 


S 






CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


in 


CD 




00 


Oi 


o 




CM 


CO 




in 


CD 




00 


o> 


O 






CD 


CD 




CD 








IV 






1^ 








CO 


00 




^ 




1 


? 


? 


? 




? 


? 




? 


5 




? 




5 




CM 


CO 


s 


in 


CD 




00 


Oi 


o 




CM 


CO 




in 


CD 




o 


O 


o 


o 


O 


o 


o 


O 


r— 






T- 










CD 


CD 


CD 


CD 


CD 


CD 


CO 


CD 


CD 


CD 


CO 




CD 


CD 


CD 


CD 


CD 


CD 


CD 


CO 


CD 


CD 


CD 


CD 


CD 


CD 


CD 


CO 


CD 


CD 


CD 


CD 


CD 


CD 


0 


o 


D 


o 


o 


e 


o 


o 


o 


e 


o 


o 


o 


o 




o 


o 


C 


C 


c 


C 


C 


C 


c 


C 


C 


C 


c 


C 


C 


C 




C 


C 


O 


O 


O 


O 


O 


O 


Q 


O 


O 


O 


O 


O 


O 


O 


o 


O 


O 


a 




O 




o 


o 


O 


o 


o 


o 


O 


o 


s 


o 


O 


o 


o 


LU 




UJ 
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UJ 


UJ 


UJ 


UJ 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


€0 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



V. ""Z S'-^ 



wo 02/092818 



412 



PCT/IB02/03059 



TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 k SEQ ID No. 
139 sur la s&iuence g^nomique complete (SEQ ID No. 2345). 







Position sur g^ndme 
complet (= SEQ ID n**2345) 


Sens 


SEQ ID 


Contig 


position D6biit 


position Fin 


(m=minus / 
psplus) 


SEQ ID n'l 


Contlgl 


1356648 


1355991 


m 


SEQ ID n''2 


Contlg2 


341651 


341120 


m 


SEQ ID n°3 


ContIgS 


476798 


476418 


m 


SEQ ID nM 


Contig4 


1475712 


1475086 


m 


SEQ ID n'5 


ContigS 


784818 


784243 


m 


SEQ ID n°6 


ContigG 


1756826 


1757251 


P 


SEQ ID n°7 


Contlg7 


1950108 


1949648 


m 


SEQ ID n'8 


ContigS 


138225 


138876 


P 


SEQ ID n°9 


ContigQ 


2097891 


2098283 


P 


SEQ ID n'10 


ContiglO 


1238491 


1237984 


m 


SEQ ID n^11 


Contigl 1 


1882130 


1881745 


m 


SEQ ID n*12 


Contlgl 2 


1089348 


1088935 


m 


SEQ ID n*13 


Contigl 3 


555788 


555189 


m 


SEQ ID n*14 


Contig14 


2017928 


2017437 


m 


SEQ ID n**15 


Contigl 5 


1154094 


1154701 


- p 


SEQ ID n^16 - 


Contigl 6 


752647 


753091 


- ^ p 


SEQ ID n*17 


Contlgl 7 


1355561 


1355078 




SEQIDn**18 


Contigl 8 


1255951 


1256101 


P 


SEQ IDn^'IS 


Contigl 9 


792712 


793148 


P 


SEQ ID n*20 


Contig20 


481787 


482228 


P 


SEQ ID n'22 


Contig22 


1590263 


1590842 


P 


SEQ ID 0^*23 


Contig23 


508269 


508918 


P 


SEQ ID n*24 


Contlg24 


1142198 


A A A^AOO 

1 142488 


P 


SEQ ID n*25 


Contig25 


1982019 


1981737 


m 


SEQ ID 11*^26 


Contig26 




11QQ1Q 


P 


SEQ ID n''28 


Contig28 


1124069 


1123256 


m 


SEQ ID n**29 


Contig29 


266586 


266900 


P 


ScQ lU n ou 


uoniigou 


111013 


111623 


P 


SEQ IDn"31 


Contig31 


1804173 


1804706 


P 


SEQ ID n'32 


Contig32 


2170341 


2169828 


m 


SEQ ID n"33 


Contig33 


1959867 


1959394 


m 


SEQ ID n'34 


Contig34 


1295529 


1294939 


m 


SEQ ID n"35 


Contig35 


178592 


178071 


m 


SEQ ID n"36 


Contig36 


1857103 


1856614 


m 


SEQ ID n"37 


Contlg37 


1063484 


1063911 


P 


SEQ ID n*'38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID nMO 


Contig40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 


P 


SEQ ID nM2 


Contig42 


729008 


728453 


m 


SEQ ID nM3 


Contig43 


1671733 


1672151 


P 
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SEQ ID n^44 


Contic)44 


1103091 


1103644 


0 


SEQ ID nM5 


Contig45 


700139 


699583 


m 


. SEQ ID n**46 


Contig46 


207521 


206897 


m 


SEQ ID nM7 


Contlg47 


1064808 


1065099 


P 


SEQ ID nM8 


Contig48 


1091636 


1092281 


P 


SEQ ID nM9 


Contiq49 


1701764 


1700906 


m 


SEQ ID n"50 


ContigSO 


609072 


609590 


P 


SEQ ID n*51 


Contig51 


1459271 


1458780 


m 


SEQ ID n*^52 


Contig52 


60603 


60154 


m 


SEQ ID n'53 


Contig53 


289646 


289284 


m 


SEQ ID n*^54 


Contig54 


1536438 


1536058 


m 


SEQ ID n^'SS 


ContigSS 


509420 


510430 


P 


SEQ ID n^'Se 


Contig56 


1559964 


1558709 


m 


SEQ ID n^'SS 


Contig58 


2166712 


2165923 


m 


SEQ ID n'59 


Contig59 


1919605 


1920984 


P 


SEQ ID n*60 


Contig60 


962333 


960438 


m 


SEQ ID n"61 


Contig61 


1363649 


1365724 


p 


SEQ ID n'62 


Contig62 


1140306 


1137284 


m 


SEQ ID n<*63 


Contig63 


1702242 


1706039 


P 


SEQ ID ri*64 


Contlg64 


1490271 


1493283 


p 


SEQ ID n^65 


ContigSS 


783206 


785628 


p 


SEQ ID 0*^66 


Contig66 


852318 


849615 




SEQIDn**67 


Contig67 


1B82303 


1880181 


> . . m : . / 


- SiEQlb n°68 ; 


: Contig68 


1614050 ; 


- 1618058 


"- - -^p^^.^ ^ ; 


SEQIDnm 


Contlg69 


1484885. 


1490042 




SEQIDri^70 


" Contig70 


510495 


516449 




SEQ ID n"71 


Contlg71 


125082 


121213 


m 


SEQ ID nV2 


Contlg72 


1557644 


1551892 


m 


SEQ ID nV3 


Contig73 


145707 


143269 


m 


SEQ ID n'^74 


Contig74 


859105 


852465 


m 


SEQ ID nV5 


Contig75 


1219383 


1215342 


m 


SEQ ID n"76 


Contig76 


1091627 


1086724 


m 


- SEQIDn"77 


Contig77 


1245976 


1251984 


p~ 


SEQ ID nV8 


Contig78 


115260 


121688 


p 


SEQ ID n*79 


Contig79 


1100300 


1092624 


m 


SEQ ID n**80 


Contig80 


1107948 


1100525 


m 


SEQ ID n"81 


Contig81 


1245466 


1237461 


m 


SEQ ID n**82 


Contjg82 


2111296 


2104033 


m 


SEQ ID n'83 


Contig83 


33479 


27132 


m 


SEQ ID n'84 


Contig84 


1339614 


1350526 


P 


SEQ ID n^85 


Contig85 


2070423 


2058143 


m 


SEQ ID n'86 


Contig86 


1462530 


1470059 


P 


SEQ ID n"87 


Contig87 


526582 


517432 


m 


SEQ ID n'88 


Contig88 


1484487 


1470171 


m 


SEQ ID n'89 


Contig89 


1124087 


1136746 


P 


SEQ ID n'90 


Contig90 


1879890 


1866931 


m 


SEQIDn^91 


Contig91 


1721684 


1706045 


m 


SEQ ID n'92 


Contlg92 


1358184 


1357897 


m 


SEQ ID 0*^93 


Contig93 


1577596 


1560798 


m 


SEQ ID n^94 


Contig94 


115130 


103188 


m 
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SEQ IDn"95 


Contiq95 


1921051 


1933881 


0 


SEQ IDn*96 


Contig96 


1944905 


1933782 


m 


SEQ ID n*97 


Contig97 


1919624 


1906953 


m 


SEQ IDn«98 


Contlg98 


2090559 


2103658 


0 


SEQ ID n"99 


Contig99 


1237482 


1219423 


m 


SEQ ID n'^lOO 


ContiqIOO 


1123110 


1108191 


m 


SEQ ID n'^IOI 


ContiQiOl 


1551836 


1529458 


m 


SEQ ID n^102 


Contig102 


1818811 


1800978 


m 


SEQ ID n**103 


Contlg103 


764781 


783195 


P 


SEQ ID n''104 


Contig104 


1086606 


1065938 


m 


SEQ ID n*105 


Contig105 


125425 


143102 


0 


SEQ ID n**106 


Contig106 


962438 


984387 




SEQ ID n*107 


Contig107 


1169838 


1190193 


0 


SEQ ID n'^IOS 


Contig108 


2090426 


2070667 


m 


SEQ ID n*'109 


Contlq109 


1140315 


1169462 


P 


SEQ ID n^111 


ContlgHI 


238297 


258413 


P 


SEQ ID n"112 


Contig112 


216686 


237881 


P 


SEQ ID n*113 


Contig113 


2209521 


16967 


m 


SEQ ID n"114 


Contig114 


1883537 


1906918 


P 


SEQ ID n'*115 


Contig116 


145772 


172009 


P 


SEQ ID n°116 


Contig116 


508181 


477405 


m 


SEQ ID n**117 


Contlg117 


859233 


888273 


P 


SEQ ID n*118 


Contig118 


1529046 


1494213 


m 


SEQIDn*119 


Contig119, 


473132 


438871 


m 


SEQ ID n*120 


Gontig120 


1981657 


1945366 


m 


SEQ ID n'12i ^ 


Contig121 


1613824 . 


1577594 


m 


SEQ ID n"122 


-'Contig122"^ 


' 1765846 


1800817 


P 


SEQ ID n"123 


Contig123 


2111499 


2153851 


P 


SEQ ID n'124 


Contig124 


1721668 


1765765 


P 


SEQ ID 0*126 


Contig125 


984406 


1026178 


P 


SEQ ID n'126 


Contlg126 


1293488 


1339586 


P 


SEQ ID 0*^127 


Contig127 


216691 


176332 


m 


SEQ ID n**128 


Contig128 


1818941 


1866861 


P 


SEQ ID n'129 


Contlg129 


849565 


785796 


m 


SEQ ID n*130 


Contig130 


888292 


960270 


P 


SEQ ID n'*131 


Contig131 


2208563 


2155215 


m 


SEQ ID n''132 


Contig132 


33590 


88267 


P 


SEQ IDn**133 


Contig133 


1982609 


2057812 


P 


SEQ ID n''134 


Contig134 


1700642 


1618142 


m 


SEQIDn*135 


Contig135 


1293063 


1190375 


m 


SEQ IDn*^136 


Contig136 


1366980 


1462324 


P 


SEQ IDnM37 


Contig137 


390853 


434186 


P 


SEQIDn"138 


Contig138 


357393 


259739 


m 


SEQ ID n''139 


Contig139 


527049 


716899 


P 
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TABLEAU 5 > Propriit^ d'adh^rence k des cellules ^pith^Iiales humaines en culture de la 
souche NEM3 1 6 de 5. agalactiae et de souches mutantes d^ri vees. 



Souche 


Gene inactive 


^/od'adh^sion' 






Cellules AS49 


Cellules Hela 


NEM316 


aucun 


9 


16 


hfEM1979 


IPFN'»1268(ir//4) 


1,5 


2 


NEM20S6 


IPFN*678 


2 


n.t 


NEM2057 


IPFN-1503 


4,5 


n.t. 



5 ^ le pourcentage d'adh^sion correspond au nombre de bacteries (Unit^ Formant des 
Colonies, UFC) restant adh^ntes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre dUFC ajoutees k la monocouche de cellules ^pith61iales. 
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Amidase 


Amylopullulanase alkaline 


mconnue 
inconnue 


mconnue 
inconnue 


inconnue 


Surface exclusion protein 


inconnue 


Surface exclusion protein 


inconnue 


mconnue 


inconnue 


Prot6ine liant la fibronectine 


inconnue 
inconnue 


inconnue 


inconnue 


36 (54)/ 478 
35(54)7492 


65 (79)/ 1095 


23(47)/ 373 
26(50)/ 273 


37(52)/ 405 
36(52)/ 399 


33 (49)/ 225 


24 (37)/ 715 


31 (47)/ 263 


22 (40)/ 784 


33 (47)/ 211 






32(46)/ 176 


27(42)/ 512 
25(38)/ 577 






AmiC {S, pyogenes) 
YbgE (L lactis) 


PulA (S. pyogenes) 


CGI 5040 gene product Drosophila 

melanogaster'- 
Antigen p200 {Babesia bigemina) 


SpaA ( S. sobrihus) 
j Pas {S, intermedius) 


Plasmid-encoded protein (K faecalis) 


is 

o 
o 

CO 


Plasmid-encoded protein {Kfaecalis) 


! 

o 
o 

CO 


Plasmid-encoded protein (Kfaecalis) 


' No homology in public databases 


No homology in public databases 


PFBP (5. pyogenes) 


Hypothetical protein 2 (Lactobacillus 
leichmannii) , 
Fimbrial structural subunit (Actinomyces 
, naesluhdii) ^ 


No homology in public databases 


No homology in public. ^databases 
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VO 
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OO 
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00 


2334 


6247 


DO 


5741 


4921 


o 

0\ 
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in 


5180 


4706 


4708 ! 


5677 


6246 


6411 


5578 


6446 


6447 


5607 
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inconnue 
inconnue 


Protease k serine 


C5a peptidase 


5'-nucleotidase secretee 


inconnue 


1050 
^566 


1194 


1150 


00 
00 
VO 




72 (81)/ 
24(41)/ 


38(55)/ 


/ (66)66 


60(74)/ 




SPy0843 (5. pyogenes) 
spA (Bacteroides forsythus) 


ScpB (S. agalactiae) 


ScpB (S. agalactiae) 


SPy0872 (S. pyogenes) \ 


homology in public databases 


CQ 








No 


LPXT/S 




LPXT/N 




FPKT/G 


1055 


1233 


1150 


o 

ON 

VO 


o 

00 


00 

m 


r- 

in 


2082 ! 


2390 


1551 


6209 


6215 


5406 


5658 


4965 
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TABLEAU 7 . Distribution des gdnes codant pour des prot^ines de siuface k motif 
LPXTG-paimi des isolats cliniques ind^pendants de S serotypes dcS. agalactiae. - * 



SeqID 

(ADN) 


N^d'IPF 


Proportion des souches portant le gtoe 


Type la 
23 isolats 


Type lb 
7 isolats 


Type II 
12 isolats 


Type III 
39 isolats 


Tvue V 

16 
isolats 


non 
group^ 
2 isolats 


Frequence 
totale 
99 isolats 


4926 


1503 


100 


100 


100 


100 


100 


100 


100 


6331 


678 


100 


100 


100 


100 


100 


100 


100 


5491 


2192 


100 


100 


100 


100 


100 


100 


100 


5234 


1861 


100 


100 


100 


100 


100 


100 


100 


6246 


584 


100 


100 


100 


100 


100 


100 


100 


5842 


280 


100 


100 


100 


100 


100 


100 


100 


6247 


585 


86,9 


85,7 


91,7 


92,3 


81,3 


100 ; 


88,9 


4965 


- 1551 


34,8 


85,7 


100 


94,8 


93,8 


100 


8Qi8 


6447 


: 807 , 


26,1 

^vry M. 


85,7 - 


83,3 


92,3 


- 93.8 


100 r 


79i8:l 


5610 


2337 


86,9 


100 


100 


56,4 


100 


50 


78,8 


6236 


571 


82,6 


100 


83,3 


46,1 


100 


50 


71,7 


5103 


1716 


91,0 


100 


83.3 


38,5 


81,3 


50 


67,7 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71.4 


41.7 


61.5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41.7 


59 


12.5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20.5 


6.3 


0 


13.1 


5180 


18 


4,3 


14.3 


0 


20.5 


6,3 


0 


11.1 


4706 


1248 


0 


0 


0 


12.8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8.3 


5.1 


0 


0 


4.5 


4708 


1250 


0 


14.3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 


0 


0 


7.7 


0 


0 


3 
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TABLEAU 8 . Lipoprot6ines 



SeqID 

(ADN) 


d'IPF 


Annotation 


6527 


9 


unknown 


6030 


339 


similar to unknown proteins 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


460 


Similar to ABC transporter (binding protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protem) 


4596 


1119 


similar to ribose ABC transporter (binding protein) 


4636 


1162 


similar to (amino acid ?) ABC transporter (bmdmg protein) 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protem) 


4836 


1399 


similar to phosphate ABC transporter (bindmg protem) 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl-prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protem) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein} 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/camitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIlIJ protein 


5450 


2133 


laminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 
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5559 


2278 


putative ABC transporter (binding protein) 


5591- 


2314- 


similar to protease maturation protein - '- '"r- 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


Similar to amino acid ABC transporter (bmding protem) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoprot^ines ont it€ identifies sur la base de la 
prediction du motif de coupure / modification de type lipopr6t6ine [S^ Hayashi, H. C, 
Wu. J Bioenerg Biomembf. 22^451 (1990)] signal (idehtifi'd eh utilisSit^ 

5 SignalP y's2:0 [H Nielsen; /Vo/ 12, 13^9: (1999)]) et par ranalyse des re^^ 

comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al.. Nucleic Acids Res 25, 3389-402. (1997)]. 

Tableau 9 . Autres prot^ines de surface 



10 



SeqID 

(ADN) 


N» d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 
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Ces proteines ont et6 identifies sur la base de similarity avec d'autres protdines 
de surface bact^rienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrtes au peptidoglycane et lipoprot^ines. 



5 TABLEAU 10 . Proteines impliqu&s dans la biosynthdse de composes 
polysaccharidiques de la parol de S. agalactiae. 



Seq ID 

(ADN) 


N" d IFF 


Annotation 




4861 


1430 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




6061 


381 


Unnown, Similar to UDP-N-acetylmuramoylalanine-D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to glycosyltransferases 




6343 


692 


similar to hexosyltransferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthtee de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta- 1 ,4-galactosyl transferase 


5614 


2341 


beta-l,4-galactosyItransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4,6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 
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5602 


2329 


similar to capsular poiyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyltransferase 




5573 


2296 


Similar to iliamnosyl transferase I 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyltransferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


.555; 


Similar to putative glucosyl transferase 


... 


6229 


562 . . 


Siiriilaf to hypothetical glycosyl transferase 


- ■ • ^- — . 


6230.; 


-.563 


Similar to putative glycosyltransferase . 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567- 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont 6te identifies par i*analyse des resultats de similarite avec les 
sequences proteiques connues en utilisant ie logiciel BLASTP. Les produits de ces 
g^nes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinates. 
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REVENDICATIONS 

1. Sequence nucl6otidique isolde de Streptococcus agalactiae, caract^ris^e en 
ce qu'elle est choisie parini les s&iuences SEQ ID No. 1 & SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucltotidique isol6e de Streptococcus dgalactiae^ caract^ris^e en 
ce qu'elle est choisie parmi : 

a) line s6qurace nucltotidique comportant au moins 75 % d'identit^ avec une sequence 
choisie panni SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345 ; 
10 b) une s^uence nucltotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 4 SEQ ID No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucltotides ; 
c) une sequence nucltotidique compl6mentaire d'une sequence choisie parmi SEQ ID 
No. 1 & SEQ ID No. 139 et SEQ ID No. 2345, ou compMmentaire d'une s^uence 
15 nucl^otidique telle que d^finie en a), ou b), ou une sequence nucltotidique de T ARN ' 
.V. . ^cprrcspondant a l-une des sequences a) ou b) ; \.' . - '-^ 

- d)-une sequence nuclfotidique d'un fragment repr6sentatif- d'line s&juenqe choisie'" 
T " parmi SEQ ID No. 1 4 SEQ ID No. 139 et SEQ ID No. 2345, bu d'un fiagment 
repr^sentatif d'une sequence nucltotidique telle que d^finie en a), b) ou c) et 
20 comprenant au moins 20 nucleotides ; 

e) une s^uence nucldotidique comprenant une sequence telle que d^finie en a), b), c) 
oud);et - - - 

{) une sequence nucleotidique telle que d^finie en a), b), c), d) ou e) modifi6e et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 
25 reference. 

3. sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 k SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 & SEQ ID No. 2344 et SEQ ID No. 

30 2346 4 SEQ ID No. 4481. 

4. sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie panni les sequences 
SEQ ID No. 4482 & SEQ ID No. 6617 ; 
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b) une s^uence nucltetidique comportant au moins 75 % dMdentit^ avec une sequence 
nucltotidique selon la revendication 3 ; 

c) une s&iuence nucI6otidique s'hybridant dans des conditions de forte stringence avec 
line sequence nuclSotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucltotidique compl6mentaire ou d'ARN correspondant k une 
s^uence telle que d^finie en a), b) ou c) ; 

e) une sequence nuclfotidique d'un fragment repr&entatif d'une sequence telle que 
d^finie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que d^finie en a), b), c), d) ou e) modifiee et comportant au plus 
10 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucieotidique selon Tune des 
revendications 2 k 4. 

6. Polypq>tide selon la revendication 5, caracterise en ce qu*il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 k SEQ ED No. 2344, et SEQ ID No. 

2346 iSEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi paimi : 

a) un polypeptide selon Tune des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon I'une 
20 des revendications S et 6 ; 

c) un firagment d'au moins S acides amines d'un polypeptide selon Tune des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d*un polypeptide selon Tune des revendications 5 
et 6, ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon Tune des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport k la 
sequence de reference. 

8. sequence nucieotidique codant pour un polypeptide selon la revendication 

7. 

30 9. sequence nucieotidique isoiee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 k 
SEQ ID No. 2344 et SEQ ID No. 2346 k SEQ ID No. 4481 , 
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10. Sequence nucI6otidique selon Tune des revendications 2 & 4, 8 et 9, 
- caiact^ris^e en ce qu'elle code pour un polypeptide de Streptococcus agdlactiae 

impliqu6 dans la biosynth&se des acides amines ou Tun de ses finagments. 

11. Sequence nuclfotidique selon Tune des revendications 2 & 4, 8 et 9, 
5 caract^s^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

impliqu6 dans la biosynth^se des cofacteurs, groupes prosthitiques et transporteurs ou 
Tunde ses fragments. 

12. S&iuence nucldotidique selon Tune des revendications 2 & 4, 8 et 9, 
caract^s^e en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situ6 h la 

10 sur£u:e de 5/r€ipfococcu5 a^a/acrfae ou Fun de ses fragments. 

13. Sequence nucldotidique selon Tune des revendications 2 si 4, 8 et 9, 
caractdris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
impliqu6 dans la machinerie cellulaire ou I'un de ses fragments. 

14. S^uence nucleotidique selon Tune des revendications 2 & 4, 8 et 9, 
15 caracteris6e en ce qu!elle code pour un polypeptide de . Streptococcus agaldctiae/ 

impliqu^ dans le mitabolisme interm^diaire central ou I'un de ses fragmenis. ^^^^ 
? ^. ^ 15. Sequence nucl^tidique\selon l?une des revendications 2 a 4, 8 etf 9,- 
caract6ris^e en ce qu'elle code pour un polypeptide de Streptococcus agaldctiae 
impliqu^ dans le m^tabolisme 6nerg^nique ou I'un de ses fragments. 
20 16. Sequence nuclfotidique selon I'une des revendications 2 & 4, 8 et 9, 

caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
impliqu^ dans le m6tabolisme des acides gras et des phospholipides ou I'un de ses 
fragpients. 

17. Sequence nucleotidique selon I'une des revendications 2 & 4, 8 et 9» 
25 caractdris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

impliqu6 dans le mdtabolisme des nucleotides, des purines, des pyrimidines ou 
nucltosides ou I'un de ses fragments. 

18. Sequence nucleotidique selon I'une des revendications 2 i 4, 8 et 9, 
caractiriste m ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 impliqud dans les fonctions de regulation ou I'un de ses fragments. 

19. sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caractdrisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou I'un de ses'fragments. 
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20. Sequence nucl^otidique selon Tune des revendications 2 & 4, 8 et 9, 
caract^ris^e en ce qu^elle code pour un polypeptide de Streptococcus agalactiae 
impliqu^ dans le processus de transcription ou Tun de ses fragments. 

21* S&iuence nucl^otidique selon Tune des revendications 2 & 4, 8 et 9, 
5 caractdrisfe en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
impliqu6 dans le processus de traduction ou Tun de ses fiagments. 

22. Sequence nucl6otidique selon Tune des revendications 2 & 4, 8 et 9, 
caract6ris^ en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
impliqu^ dans le processus de transport et de liaison des prot^ines ou Tun de ses 

10 fragments. 

23. Sequence nuclfotidique selon Tune des revendications 2 & 4, 8 et 9, 
caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans Tadaptation aux conditions atypiques ou I'un de ses firagments. 

24. Sequence nucl^otidique selon Tune des revendications 2 & 4, 8 et 9, 
15 caract^ris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

impliqu6 dans la sensibilite aux medicaments et analogues ou Tun de ses fragments. 

25. Sequence nucl6otidique selon I'une des revendications 2 & 4, 8 et 9, 
caract^ris^ en ce qu'elle code pour un polypeptide de Streptococcus agalactiae ^ 
impliqu6 dans les fonctions relatives aux transposons ou I'lm de ses fiagments. 

20 26. Sequence nucl^otidique Isolde de Streptococcus agalactiae, caractdrisee en 

ce qu^elle est choisie parmi : 

a) une sequence choisie paimi les sequences SEQ ID 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247.5842,5741,4921,5090.518 
0,4706,4708,5677,6246,641 1,5578,6446,6447,5607,6209.621 5,5406,5658,4965, de 

25 pi«f6rence parmi les sequences SEQ ID N^4926,633 1,5491,5234,6246,5842 ; 

b) une s^uence nuclfotidique comportant au moins 75 % d'identitd avec une 
sequence nucldotidique du a) ; 

c) une s^uence nucldotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucldotidique du a) ou b) et comprenant au moins 20 

30 nucltotides ; 

d) une s^uence nucleotidique compl6mentaire ou d' ARN correspondant k une 
sequence telle que definie en a), b) ou c) ; 

e) une s&)uence nucleotidique d*un fragment repr^sentatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) tine Sequence telle que d^finie en a), b), c), d) ou e) modifite et comportant 
au plus 10% de nucleotides modifies par lapporti la s^uenceder^fiSr^ 

et en ce qu'elle code pour une protiine de surface avec un motif d*ancrage 
LPXTG. 

5 27. Sequence nucl^otidique isol6e de Streptococcus agalactiae^ caract^ris^e en 

ce qu'elle est choisie painii les sequences SEQ ID 
N^6035,6137,6335.6377,6386,4495,4596,4636,4730,4816,4836,4906,4920,4^^ 
247, 5306,5417,5450,5486,5559,5591.5677,5732,5799,5800,5861,5923 et en ce qu'elle 
code pour une lipoprot^ine. 
10 28. S^uence nucltotidique isolee de Streptococcus agalactiae, caract£ris6e en 

ce qu'elle est choisie parmi les s&iuences SEQ ID 
N«'4861,6214,6061,6517.6518,6519,4743,6343,6342,5326,4952,5619,5618,5617,5616,5 
615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527.5529 
,5534.5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 
15 qu'elle code pour une protdine impliqute dans la biosynth&se de coihpdsds 
' polysaccharidiques de parbi. - ^ - : ^ . 

H - 29.-' Polypeptide selon l 'une des^ievendicalio^ 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu^ dans la biosynthSse des 
acides amin^ ou Tun de ses fragments. 
20 30. Polypeptide selon Tune des revendications 5 a 7. caracteris^ en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans la biosynth&se des 
cofacteurs, groupes prosth6tiques et transporteurs ou Tun de ses fragments. 

31. Polypeptide selon I'une des revendications 5 & 7. caiact^ris^ en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ£ k la surface de Streptococcus 

25 agalactiae ou I'un de ses fragments. 

32. Polypeptide selon I'une des revendications 5 4 7, caract^ris^ en ce qu'il 
. s'agit d'un polypeptide de Streptococcus agalactiae impliqu^ dans la machinerie 

cellulaire ou I'un de ses fragments. 

33. Polypeptide selon I'une des revendications 5 & 7, caract£ris£ en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans le metabolisme 

intermMiaire central ou I'un de ses fragments. 

34. Polypeptide selon I'une des revendications 5^7, caract6ris^ en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae' impliqu6 dans le m6tabolisme 
£nerg6tique ou I'un de ses fragments. 
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35. Polypeptide selon Tune des revendications 5 4 7, caractiris^ en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans le m^tabolisme des 
acides gras et des phospholipides ou Tun de ses fragments. 

36. Polypeptide selon Tune des revendications 5 4 7, caiact6ris6 en ce qu*il 
5 s'agit d'un polypeptide de Streptococcus agalactiae impliqui dans le mitabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou Tun de ses fragments. 

37. Polypeptide selon Tune des revendications 5 a 7, caract^rise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans les fonctions de 
regulation ou Tun de ses fragments. 

-|0 38. Polypeptide selon I'line des revendications 5 a 7, caiact6rise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans le processus de 
replication ou I'un de ses fragments. 

39. Polypeptide selon Tune des revendications 5 4 7, caract6rise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu* dans le processus de 

1 5 transcription ou I'un de ses fragments. 

40. Polypeptide selon I'une des revendications 5 4 7, caractfirise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou I'un de ses fragments. 

41. Polypeptide selon I'une des revendications 5 4 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou I'un de ses fragments. 

42. Polypeptide selon I'une des revendications 5 4 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans I'adaptation aux 
conditions atypiques ou I'un de ses fragments. 

25 43. Polypeptide selon I'une des revendications 5 4 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibilite aux 
medicaments et analogues ou I'un de ses fragments. 

44. Polypeptide selon I'une des revendications 5 4 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fi)nctions 

30 relatives aux transposons ou I'un de ses fragments. 

45. Polypeptide selon I'une des revendications 5 4 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrageLPXTG. 
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46. Polypeptide selon Tune des revendications S & 7, caract^ris^ en ce qu'il est 
cod6 par une sequence selon la revendication 27 et est une lipoprot^ine. 

47. Polypeptide selon Tune des revendications S & 7, caract^ris^ en ce qu*il est 
cod6 par une sequence selon la revendication 28 et est une prot^ine impliqute dans la 

5 biosynthise de composes polysaccharidiques de parol. 

48. S^uence nucl6otidique utilisable conune amorce ou comme sonde, 
caract&is6e en ce que ladite s^uence est choisie panni les sequences nucl^otidiques 
selon Tune des revendications 2 & 4, 8 & 28. 

49. Sequence nucltotidique selon la revendication 48, caract^iis^e en ce qu'elle 
10 est marquee par un compost radioactif ou par un conipos6 non radioactif. 

50. Sequence nuclfotidique selon Tune des revendications 48 et 49, caractdris^ 
en ce qu'elle est inunobilisfe sur un support, de maniire covalente ou non-covalente. 

51. Sequence nucliotidique selon la revendication SO, caract6ris6e en ce qu'elle 
est immobilise sur un support tel qu'un filtre k haute density ou une puce & ADK 

15 52. Sequence nucl^qtidique selon Tune des revendications 49 & 51 pour la 

d£te(kiQn et/ou ramplification de s6quenc^ 

. 53. Puce k ADN bu filtre, c^aractiiris^ en ce qu'elle contient au moins.une^ 
sequence nucl&)tidique selon la revendication 51. 

54. Puce k ADN ou filtre selon la revendication 53, caractdriste en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur le support de ladite puce. 

55. Puce k ADN ou filtre selon la. revendication 54, caract6ris6e en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associd k Streptococcus 
agalactiae, une bact^e du genre Streptococcus^ et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou n^cessaire pour la detection et/ou I'identification de bact^ries 
appartenant k I'esptee Streptococcus agalactiae ou & un micro-organisme associ6, 
caract6ris6 en ce qu'il comprend une puce k ADN ou un filtre selon la revendication 53. 

57. Kit ou n^essaire pour la detection et/ou I'identification d'un micro- 
30 organisme, caract6ris6 en ce qu'il comprend une puce k ADN ou un filtre selon Tune des 

revendications 54 et 55. 

58. Kit ou ndcessaire pour la detection et/ou la quantification' de I'expression 
d'au moins un g&ne de Streptococcus agalactiae, caract^ris^ en ce qu'il comprend une 
puce a. ADN ou un filtre selon I'une des revendications 53 k 55. 
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59. Vecteur de clonage, et/ou d'expression, caiact6ris£ en ce qu'il contient une 
sequence nucl&tidique selon Tune des revendications 1 & 4, 8 & 28. 

60. Cellule hote, caract6ris6e en ce qu'elle est transform^ par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caract^risfe en ce qu*il s*agit d'une 

bact^rie appartenant au genre Streptococcus, 

62. Cellule hdte selon la revendication 61, caract4ris6e en ce qu'il s'agit d'une 
bact^rie appartenant a Tespfece Streptococcus agalactiae. 

63. V6g6tal ou animal, excepte THomme, comprenant une cellule transform^ 
1 0 selon Tune des revendications 60 k 62. 

64. Proc^d6 de preparation d'un polypeptide, caractdris^ en ce que Ton cultive 
une cellule tiansforni6e par un vecteur selon la revendication 59 dans des conditions 
permettant Texpression dudit polypeptide et que Ton recupSre ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un proc6d6 selon la 

revendication 64. ^ 

66. Pn>c6d« de preparation d'un polypeptide synthetique selon Tune des 
revendications 5 4 7, 29 & 47, caractdrise en ce que I'on efFectue une synthise chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caract6risd en ce qu'il comprend au moins la sequence 

d'un polypeptide selon Tune des revendications 5 4 7, 29 i 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une rdponse immuniteire chez rhomme ou 
I'animal. 

68. Sequence nucleotidique codant pour un polypeptide hybride selon la 

25 revendication 67. 

69. Vecteur caiactdrisi en ce qu'il contient une sequence nucleotidique selon la 

revendication 68. 

70. Anticorps monoclonal ou polyclonal, ses fiagments, ou anticoips 
chimirique, caractirisd en ce qu'il est capable de reconnaitre spdcifiquement un 

30 polypeptide selon Tune des revendications 5 i 7, 29 i 47, 65 et 67. 

71. Anticoips selon la revendication 70, caract6ris6 en ce qu'il s'agit d'un 
anticorps marqud. 



wo 02/092818 



433 



PCT/ro02/03059 



72 Proc^d^ pour la detection et/ou Pidentification de bact^ries appartenant h 
I'espftce Streptococcus agalactiae ou i un micro-organisme associi dans un ^haiitillon 
biologique, caract^risi en ce qu'il comprend les Stapes suivantes : 

a) mise en contact de Tdchantillon biologique avec un anticoips selpn Tune des 
5 revendications 70 et 71 ; 

b) mise en Evidence du complexe antigdne-anticoips ^ventuellement fonn£. 

73. Proc^£ pour la detection de Texpression d'un g6ne de Streptococcus 
agalactiae caiact^ris^ en ce que Ton met en contact une souche de Streptococcus 
agalactiae^ avec un anticoips selon la revendication 70 ou 71 et que Ton d^tecte le 

10 complexe antig&iie/anticoips ^ventuellement fonn6. 

74. Kit ou n^cessaire pour la mise en oeuvre d'un proced6 selon la revendication 
72 ou 73, caract^ris^ en ce qu'il comprend les £16ments suivants : 

a) un anticoips selon Time des revendications 70 et 71 ; 

b) ^ventuellement, les r6acti& pour la constitution du milieu propice k la reaction 
15 immunologsque ; ... 

^ x) ^yentuellenient, les.r£actifs .pennet^ 

anticoips prpduite par la taction immunologiqu 

75. Polypeptide selon Tune des revendications S & 7, 32 i 47, 65 et 67, ou 
anticoips selon Tune des revendications 64 et 65, caracteris^ en ce qu*il est inmiobilis^ 

20 surun support, notanunent une puce &prot£ine. 

76. Puce a piot^ine, caract^risde en ce qu*elle contient au moins un polypeptide 
selon Tune des revendications 5 & 7, 32 i 47, 65-et 67, ou au moins un anticoips selon- 
Tune des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce a prot^ine selon la revendication 76, caracteriste en ce qu*elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins im anticoips diii^ contre un compose de micro-organisme autre 
que Streptococcus agalactiae, inunobilis^ sur le support de ladite puce. 

78. Kit ou n^cessaire pour la detection et/ou Tidentification de bact^es 
appaitenant i Tespdce Streptococcus agalactiae ou & un micro-organisme associ^, 

30 caract^rise en ce quMI comprend une puce k prot^ine selon Tune des revendications 76 
et77. 

79. Kit ou n^cessaire pour la detection et/ou I'identification d'un micro- 
organisme, caracterise en ce qu'il comprend une puce & prot^ine selon la revendication 
77. 
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80. Proc6d6 de detection et/ou d'identification de bact^ries sqipartenant k 
I'espece Streptococcus agalactiae ou a un micro-organisme associ^ dans un ^hantillon 
biologique, caract^ris^ en ce quMl met en oeuvre une sequence nuclfotidique selon Tune 
des revendications 2 ^ 4, 8, 9, 1 1 i 13, 17 i 25, 48 a 52 et 68. 
5 81. Proc^dd selon la revendication 80, caract^ris^ en ce quMl comporte les 

Stapes sixivantes : 

a) eventuellement, isolement de TADN i paitir de I'^chantUlon biologique k analyser, 
ou obtention d'un ADNc k partir de TARN de T&hantillon biologique ; 

b) amplification sp^cifique de TADN de bact^ries appartenant a respfece Streptococcus 
10 agalactiae ou a un micro-organisme associe k Taide d*au moins une amorce selon 

Time des revendications 48 a 52 ; 

c) mise en evidence des produits d'amplification. 

82. Precede selon la revendication 80, caract6ris6 en ce qu*il comprend les 
etapes suivantes : 

15 a) mise en contact d'une sonde nucl6otidique selon Tune des revendications 48 k 52, 
avec un echantilion biologique, I'acide nucleique contenu dans P6chantiIlon 
biologique ayant, le cas &heant, prealablement €16 rendu accessible k Thybridation, 
dans des conditions permettant Phybridation de la sonde k Pacide nucl6ique d'une 
bacterie appartenant a Pespece Streptococcus agalactiae ou i un micio-organisme 

20 associe ; 

b) mise en evidence de Phybride Eventuellement form6 entre la sonde nuclEotidique et 
Pacide nucleique de PEchantillon biologique* 

83. Proc6d6 selon la revendication 80, caract^rise en ce qu'il comprend les 
6tapes suivantes : 

25 a) mise en contact d'une sonde nuclEotidique immobilisee sur un support selon la 
revendication 50 avec un Echantilion biologique, Pacide nucteique de PEchantillon 
ayant, le cas EchEant, 6t6 prEalablement rendu accessible a Phybridation, dans des 
conditions permettant Phybridation de la sonde k Pacide nuclEiquc d'une bactErie 
appartenant k PespEce Streptococcus agalactiae ou a un micro-organisme associe ; 

30 b) mise en contact de Phybride formE entre la sonde nuclfotidique immobilisfe sur un 
support et Pacide nucldque contenu dans P&hantillon biologique, le cas echEant 
apres Elimination de Pacide nuclEique de PEchantillon biolopque. n'ayant pas 
hybride avec la sonde, avec une sonde nuclEotidique marquEe selon la revendication 
49; 
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c) mise en Evidence du nouvel hybride form^ i T^tape b). 
- . — -84r-Ihroc6d£ selon la revendication 83, caract^^ 
r^tape a), TADN de T^chantillon biologique ou I'ADNc obtenu 6ventuellement par 
transcription inverse de TARN de Tichantillon, est amplifi6 k I'aide d*au moins une 
5 amorce selon Pune des revendications 48 & 52. 

S5. Kit ou n6cessaire pour la detection et/ou IMdentification de bact^ries 
appartenant i Tespdce Streptococcus agcdactiae ou a un iniCTo-organisme associ6, 
caract^ris6 en ce qu'il comprend les 616ments suivants : 
a) une sonde nuclfotidique selon Tune des revendications 48 k 52; 
10 b) £ventuellement, les r6actifs ndcessaires a la mise en oeuvre d'une reaction 
d'hybridation ; 

c) ^ventuellement, au moins une amorce selon Tune des revendications 48 k 52 ainsi 
que les rdactife n^cessaires k une reaction d'amplification de T ADN. 

86. Kit ou necessaire pour la detection el/ou Tidentification de bact^ries 
15 appartenant k Tesp&ce Streptococcus agalactiae ou & un micro-organisme associS^ 

caract^s^ en ce quMl compiend les d^ents suivants : : ^ . - 

a) une sonde nuclfotidique, dite sonde de capture, selon la revendication 50 ; ^ ' 

b) une sonde oligonuclfotidique, dite sonde de r^v^lation, selon la revendication 49; 

c) £ventuellement, au moins une amorce selon Tune des revendications 48 k 52 ainsi 
20 que les r6actifs nteessaires k une ruction d'amplification de TADN. 

87. Kit ou nicessaire pour la detection et/ou Tidentification de bact^ries 
- appartenant k V^ptcc- Streptococcus agalactiae ou & un micro-organisme associ6, 

caractMs6 en ce qu'il comprend les dements suivants : 
a) au moins une amorce selon Tune des rcvendications 48 k 52; 
25 b) ^ventuellement, les rdactifi n6cessdrcs pour effectuer une reaction d'amplification 
d'ADN; 

c) ^ventuellement, un composant pennettant de verifier la siquence du fragment 
amplifi6, plus paiticuliercment une sonde oligonuclfotidique selon Tune des 
rcvendications 48 k 52. 

30 88. Procdd^ selon les revendications 72, 73 et 80 k 84 ou kit ou n^sairc selon 

les revendications 74, 78, 79 et 85 k 87 pour la detection et/ou Tidentification de 
bact6ries appartenant k I'esp^ Streptococcus agalactiae, caractdris^ en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les s^uences nucldotidiques selon Tune 
des revendications 2 & 4, 8 a 28, 48 & 52, et 68 sp6cifiques de Tespece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parini les polypeptides selon 
Tune des revendications 5 a 7, 32 4 47, 65 et 67 sp6cifiques de Tespfice Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticotps selon Tune des 
revendications 70 et 71 dirig^s centre les polypeptides choisis parmi les polypeptides 
5 selon Tune des revendications 5 4 7, 32 4 47, 65 et 67 specifiques de Tespice 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae^ caracteris^ en ce qu'elle contient au 
moins une mutation dans au moins une s&iuence nucl6otidique selon Tune des 
revendications 2 & 4, 8 & 28. 
10 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation m&ne a une inactivation du g^ne. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caract^ris6e 
en ce que la mutation mdne k une surexpression du gdne. 

92. Utilisation d'une sequence nuclfotidique selon Tune des revendications 2 k 
15 4, 8 a 28, d'un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticoips selon Tune des revendications 70 et 71, d'une cellule selon Tune des _ 
revendications 60 k 62, et/ou d'un animal transform^ selon la revendication 63 pour la - 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou dMnhiber I'expression de gSnes, et/ou de modifier la replication cellulairc 
20 de cellules eucaryotes ou procaryotes ou capables d*induire, d'inhiber ou d'aggraver 
chez un organisme aninfial ou humain les pathologies li^es k une infection par 
Streptococcus agalactiae ou par un micro-organisme associ6. 

93. Midiode de selection de compos6 capable de se lier a un polypeptide selon 
Tune des revendications 5 i 7. 32 4 47, 65 et 67, capable de se lier k une sequence 

25 nucl6otidique selon Tune des revendications 2 4 4, 8 & 28, ou aq>able de reconnaitre un 
anticoips selon Tune des revendications 70 et 71, et/ou capable de moduler, de r6guler, 
d'mduire ou d'inhiber I'expression de gfenes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies li^es a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucieotidique, 
avec une cellule transform^ selon Tune des revendications 60 k 62, et/ou 
administration dudit compose k un animal transforme selon la revendication 63 ; 
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b) d^tennination de la capacite dudit compose a se Her avec ledit polypeptide ou ladite 
« sequence nucl6otidique, ou de modider, de r^guler, d'induire ou d'inhib^*^ 

Texpression de g&nes, ou de moduler la croissance ou la replication cellulaiie, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 
5 pathologies li£es k une infection par Streptococcus agalactiae ou par un micio- 
organisme associ^. 

94. Composition phannaceutique comprenant un compost choisi parmi les 
compost suivants : 

a) une sequence nucldotidique selon Tune des revendications 2 & 4, 8 & 28 ; 
10 b) un polypeptide selon Tune des revendications S & 7, 32 & 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 7 1. 

95. Composition selon la revendication 94, 6ventuellement en association avec 
un v^hicule phaimaceutiquement acceptable. 

15 96. Composition pharmaceutique selon Tune des revendications 94 et 95 poiir la 

' prevention et je ;traitement«d*une infection par une bact6rie appartenant k Tes^p^i^ 
Streptococcus agalactiae. ... u - ■< > - • f >' f 

97. Composition immunogdne, caract^risde en ce qu'elle comprend un ou 
plusieurs polypeptides selon Tune des revendications 5 & 7, 32 & 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d*une cellule selon Tune des revendications 60 k 62, ou d*un 
vecteur selon Tune des revendications 59-ou 69- pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracteris^e en ce qii'elle contient un 
25 polynucleotide selon Tune des revendications 1 a 4, 8 & 28, un vecteur selon Tune des 

revendications 59 ou 69, et/ou une cellule selon Tune des revendications 60 k 62. 

100. Composition vaccinale, caracterisfe en ce qu'elle contient au moins un 
polypeptide cod6par un polynucleotide de sequence choisie parmi SEQ ID 
N"*! 503,678,2 192, 1 861 ,584,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce quMl 

s'agit d'une composition veterinaire 

102. Composition inununogene capable d'induire une r^ponse inununitaire 
cellulaire ou humorale pour la prevention ou le traiCement d'une infection par une 
bacterie appartenant k Tespece Streptococcus agalactiae, caracterisee en ce qu'elle 
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comprend une composition immunog&ne selon la revendication 97, ou une composition 
vaccinate selon la revendication 99 ou 100, en association avec un v^hicule 
phannaceutiquement acceptable et ^ventuellement un ou plusieuis adjuvants de 
rimmunit£ approprife. 

5 103. Banque g^nomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caiact^ris^ en ce 
que ladite banque d'ADN est clonde dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracteriste en ce quMl s'agit 
10 de la banque d^posee 4 la CNCM le 28 d6cembre 2000 sous le 1-2610. 

106. Utilisation des banques g^nomiques selon Tune des revendications 101 & 
103 pour isoler des sequences nucWotidiques sp6cifiques de Streptococcus agalactiae^ 
caract^see en ce que les sequences nucl^otidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont align&s et en ce que les 

15 donnees obtenues par cet alignement sont trait6es pour isoler lesdites sequences 
sp&ifiques. 

107. -Proced^ d'identification de sequence sp6cifique de Streptococcus 
agalactiae^ caract^rise par Talignement de sequences nucl^otidiques de Streptococcus 
agalactiae selon les revendications U 4, 8 & 9 et le traitement des donn6es obtenues par 

20 cet alignement pour isoler les sequences sp&ifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 d6pos& h la CNCM le 24 avril 2002 sous le 1-2861. 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 d6pos& a la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 diposfe & la CNCM le 24 avril 2002 sous le N** 1-2863. 
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sonde et amorce derives de la sequence nucleotidique; 
utilisation de ceux-ci pour la selection de composes ayant 
une influence sur les pathologies liees a une infection par 
S. agalactiae; compositions pharmaceutiques; puces a ADN et 
. prot§ine; kit ou necessaire contenant lesdites puces; 
vecteur de clonage, cellule hote, vegetal ou animal 
contenant la sequence nucl§otidique; utilisation des 
anti corps et des sequences nucl§otidiques pour 
r identification de Streptococcus agalactiae; souche de.S. 
agalactiae contenant une mutation dans la sequence SEQ ID 
N0:1; utilisation des sequences nucl§otidiques pour 
identifier des sequences specifiques de S. agalactiae. 
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Banque genomique de Straptococcus agalactiae et son 
utilisation 
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